楼主: 我是小趴菜
576 0

[数据挖掘工具] 搭建模型如何加载数据集 [推广有奖]

  • 0关注
  • 4粉丝

教授

35%

还不是VIP/贵宾

-

威望
0
论坛币
29650 个
通用积分
380.5350
学术水平
1 点
热心指数
1 点
信用等级
0 点
经验
7150 点
帖子
670
精华
0
在线时间
37 小时
注册时间
2022-8-30
最后登录
2023-4-4

楼主
我是小趴菜 发表于 2022-10-31 16:10:54 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

数据集通常有两个主要组件:

  • 特征 :(也称为预测变量,输入或属性)它们只是我们数据的变量。它们可以不止一个,因此由特征矩阵表示('X'是表示特征矩阵的常用符号)。所有功能名称的列表称为功能名称
  • 响应 :(也称为目标,标签或输出)这是输出变量,具体取决于特征变量。我们通常有一个响应列,它由响应向量表示('y'是表示响应向量的常用符号)。响应向量采用的所有可能值称为目标名称

加载示例数据集: scikit-learn附带了一些示例数据集,例如用于分类的虹膜数字数据集以及用于回归的波士顿房价数据集。
下面给出了一个如何加载示例数据集的示例:


# load the iris dataset as an example

from sklearn.datasets import load_iris

iris = load_iris()


# store the feature matrix (X) and response vector (y)

X = iris.data

y = iris.target


# store the feature and target names

feature_names = iris.feature_names

target_names = iris.target_names


# printing features and target names of our dataset

print("Feature names:", feature_names)

print("Target names:", target_names)


# X and y are numpy arrays

print("\nType of X is:", type(X))


# printing first 5 input rows

print("\nFirst 5 rows of X:\n", X[:5])





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:加载数据 数据集 scikit-learn printing datasets

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-3 06:15