请选择 进入手机版 | 继续访问电脑版
楼主: aongao
7016 8

机器学习UCI数据库 [推广有奖]

  • 5关注
  • 31粉丝

VIP

教授

52%

还不是VIP/贵宾

-

TA的文库  其他...

新能源&可持續發展

農業&经济

威望
1
论坛币
33743 个
通用积分
5631.2235
学术水平
153 点
热心指数
194 点
信用等级
114 点
经验
89328 点
帖子
626
精华
2
在线时间
1101 小时
注册时间
2014-1-20
最后登录
2022-4-13

aongao 发表于 2014-9-8 10:26:30 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

UCI机器学习数据库的网址:      http://archive.ics.uci.edu/ml/


数据库不断更新至2010年,是所有学习人工智能都需要用到的数据库,是看文章、写论文、测试算法的必备工具。数据库种类涉及生活、工程、科学各个领域,记录数也是从少到多,最多达几十万条。

UCI数据可以使用matlab的dlmread或textread读取,不过,需要先将不是数字的类别用数字,比如1/2/3等替换,否则读入不了数值,当字符了。


UCI数据库使用说明

此目录包含数据集和相关领域知识(后面以简短的列表形式进行的注释),这些数据已经或能用于评价学习 算法 。

每个数据文件 (*.data)包含以“属性-值”对形式描述的很多个体样本的记录。对应的*.info文件包含的大量的文档资料 。(有些文件_generate_ databases;他们不包含*.data文件。)作为数据集和领域知识的补充,在utilities目录里包含了一些在使用这一数据集时的有用资料。

地址 http://www.ics.uci.edu/~mlearn/MLRepository.html,这里的UCI数据集可以看作是通过web的远程拷贝。作为选择

本帖隐藏的内容

这些数据同样可以通过ftp获得,ftp://ftp.ics.uci.edu. 可是使用匿名登陆ftp。可以在pub/machine-learning-databases目录中找到。



注意:
UCI一直都在寻找可加入的新数据,这些数据将被写入incoming子目录中。希望您能贡献您的数据,并提供相应的文档。谢谢——贡献过程可以参考DOC-REQUIREMENTS文件。目前,多数数据使用下面的格式 :一个实例一行,没有空格,属性值之间使用逗号“,”隔开,并且缺少的值使用问号“?”表示。并请在做出您的贡献后提醒一下站点管理员:ml-repository@ics.uci.edu

下面以UCI中IRIS为例介绍一下数据集:

ucidata/iris中有三个文件:
Index
iris.data
iris.names

index为文件夹目录,列出了本文件夹里的所有文件,如iris中index的内容如下:
Index of iris
18 Mar 1996      105 Index
08 Mar 1993     4551 iris.data
30 May 1989     2604 iris.names

iris.data为iris数据文件,内容如下:
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-setosa
4.7,3.2,1.3,0.2,Iris-setosa
……
7.0,3.2,4.7,1.4,Iris-versicolor
6.4,3.2,4.5,1.5,Iris-versicolor
6.9,3.1,4.9,1.5,Iris-versicolor
……
6.3,3.3,6.0,2.5,Iris-virginica
5.8,2.7,5.1,1.9,Iris-virginica
7.1,3.0,5.9,2.1,Iris-virginica
……
如上,属性直接以逗号隔开,中间没有空格(5.1,3.5,1.4,0.2,),最后一列为本行属性对应的值,即决策属性Iris-setosa


iris.names介绍了irir数据的一些相关信息,如数据标题、数据来源、以前使用情况、最近信息、实例数目、实例的属性等,如下所示部分:
……
7. Attribute Information:
   1. sepal length in cm
   2. sepal width in cm
   3. petal length in cm
   4. petal width in cm
   5. class:
      -- Iris Setosa
      -- Iris Versicolour
      -- Iris Virginica
……
9. Class Distribution: 33.3% for each of 3 classes.


本帖隐藏的内容


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:机器学习 UCI 数据库 distribution Requirements 数据库

auirzxp 学生认证  发表于 2014-9-8 10:28:31 |显示全部楼层 |坛友微信交流群
感谢分享,正在学习呢

使用道具

Edwardu 发表于 2014-9-8 10:35:15 |显示全部楼层 |坛友微信交流群
看看了

使用道具

aiaiwo 发表于 2014-9-12 09:58:19 |显示全部楼层 |坛友微信交流群
see see

使用道具

yinjunmin 发表于 2015-5-6 15:22:50 |显示全部楼层 |坛友微信交流群
很不错啊 来学习学习

使用道具

playsboy 发表于 2015-10-23 21:23:32 |显示全部楼层 |坛友微信交流群
不错,学习了

使用道具

daazx 在职认证  发表于 2015-10-26 09:44:00 |显示全部楼层 |坛友微信交流群
一年前的帖子,不错~

使用道具

Casey_Yu 发表于 2016-3-22 22:36:47 |显示全部楼层 |坛友微信交流群
学习了

使用道具

huanghuiqun 发表于 2017-11-13 15:02:38 |显示全部楼层 |坛友微信交流群
WONDERFUL
SKS

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 16:22