楼主: zxq997
1282 8

[CDA] Scikit-learn 自带的数据集 [推广有奖]

  • 0关注
  • 0粉丝

教师

硕士生

2%

还不是VIP/贵宾

-

威望
0
论坛币
13475 个
通用积分
27.8909
学术水平
28 点
热心指数
30 点
信用等级
28 点
经验
671 点
帖子
49
精华
0
在线时间
124 小时
注册时间
2018-5-21
最后登录
2023-12-14

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

1.从scikit-learn上的datasets中直接下载的少量数据集:load_<name>()

例:(以红酒为例)

from sklearn.datasets import load_wine

Wine =load_wine()

Wine.data

2.直接从网上在线抓取的数据集:fetch_<name>()

例:(以california_housing 为例 )

fromsklearn.datasets import fetch_california_housing

california_housing =fetch_california_housing()

california_housing.data

3.计算机生成的数据集:make_<name>()

make_blobs:多类单标签数据集,为每个类分配一个或多个正太分布的点集

make_classification:多类单标签数据集,为每个类分配一个或多个正太分布的点集,提供了为数据添加噪声的方式,包括维度相关性,无效特征以及冗余特征等

make_gaussian-quantiles:将一个单高斯分布的点集划分为两个数量均等的点集,作为两类

make_hastie-10-2:产生一个相似的二元分类数据集,有10个维度

make_circle和make_moom产生二维二元分类数据集来测试某些算法的性能,可以为数据集添加噪声,可以为二元分类器产生一些球形判决界面的数据

datasets.get_data_home()方法:显示存放数据集存放的本地目录


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:单标签数据 标签数据集 计算机生成 二元分类器 二元分类

已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
经管之家编辑部 + 100 + 3 + 3 + 3 精彩帖子

总评分: 论坛币 + 100  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

本帖被以下文库推荐

为您点赞!

使用道具

藤椅
充实每一天 发表于 2019-3-25 16:19:00 来自手机 |只看作者 |坛友微信交流群
点赞~

使用道具

板凳
珍惜点滴 学生认证  发表于 2019-3-25 18:19:58 |只看作者 |坛友微信交流群
感谢分享,为您点赞!

使用道具

报纸
hifinecon 发表于 2019-3-25 19:05:05 |只看作者 |坛友微信交流群

使用道具

地板
sulight 学生认证  发表于 2019-3-25 23:16:09 |只看作者 |坛友微信交流群
谢谢分享,
很好的学习资料!

使用道具

7
从1万到一亿 在职认证  发表于 2019-3-26 07:13:40 |只看作者 |坛友微信交流群
谢谢分享,点赞!

使用道具

8
HappyAndy_Lo 发表于 2019-3-27 08:28:09 |只看作者 |坛友微信交流群

使用道具

9
bnecons 发表于 2019-3-27 10:58:55 |只看作者 |坛友微信交流群
感谢分享

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-5 23:45