楼主: aongao
2230 0

周末巨献:100+诡异的数据集,20万Eclipse Bug、死囚遗言等【二】 [推广有奖]

  • 5关注
  • 31粉丝

VIP

教授

52%

还不是VIP/贵宾

-

TA的文库  其他...

新能源&可持續發展

農業&经济

威望
1
论坛币
33743 个
通用积分
5631.2235
学术水平
153 点
热心指数
194 点
信用等级
114 点
经验
89508 点
帖子
626
精华
2
在线时间
1101 小时
注册时间
2014-1-20
最后登录
2022-4-13

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

21. 那我们假设你建造出了这样的机器“数学家”,它能在证明上为你提供帮助,但那又能怎样?你还需要一个能和你在更深层次交流的人,一个能对某些抽象的主题进行概括的人。这样,你就需要给你的机器人“喂”维基百科的数据了,所有 维基百科的数据都是免费开放的。


22. 当你对数学和维基百科都厌倦时(事实上,这些是挣不到钱的),你会决定成为一名软件工程师。这时,你面临让一个对编程没有基本概念的机器来教你编程的尴尬,在哪能找到相关的数据呢?你可以下载 730万个StackOverflow问题(这些都是免费的),所以你可以从StackOverflow和StackExchange两处得到信息来“喂”你的机器(另外还有来自Cross Validated的数据,等等)。


23. 你想过研究一下正真的友谊吗?(试一下吧,实现你成为社会科学家的愿望)。你了解正真的、柏拉图式的爱情(像海豚之间的那种感情)吗?即使暂时还不了解,你也完全可以做到,这要感谢谦虚的作者本人,当然还得感谢Mark Newman,他构建了一个由6 2只海豚组成的亲密的社区——New Zealand,远离伪装和不信任。


24. 是不是左倾的博客通常会链接到其他左倾的博客,而不是右倾的博客?好吧,其实我也不知道,但是这听起来还是很合理的。要特别感谢LadaAdamic的许可,你可以下 载2005年记录下的美国政治超链接网络


25. 谁更友好一些:是爵士乐音乐家还是海豚?你会发现我们应该将之前提到的海豚数据集和Pablo M. Gleiser、Leon Danon的 爵士乐音乐家网络数据集结合起来分析。


26. 那20世纪30年代的南方妇女和囚犯呢?谁更友好?兄弟会成员和HAM无线电话务员,谁又更友好呢?这些问题都可以用 网络数据集来解决。


27. 海豚与Slashdotters比较,结果又会怎么样呢?


28.Web2.0网站(比如Reddit)有时候会被用“投票环”这种方式作弊,很多人故意互相投票,而不在乎内容质量。我们经常会想在学术界会不会也出现这样的情况。Stanford大学有一个在线 Arxiv’s High Energy Physics文献引用网,你会从中发现类似的现象。


29. 我假设读者们都非常聪明,但也许你们还想变得更加富有,这样你就能创建下一个Bill and Melinda Gates基金会,然后拯救世界。那也许你应该开发一些新奇的交易算法。但是,在这种情况下,依据市场历史数据检验一样你的策略会更好,你可以通过此链接获取市场数据。


30. 公开产品数据( Open Product Data)网站旨在为每个品牌提供免费的条形码数据。经营理念是:建立一个特别的纹身店,只纹条形码,但允许客户选择他们想要的产品,想想看:“你的条形码表达的意义是什么?”“这样的条形码就像是一种信仰。”


31. 做中期天气预测的European Center对收集天气数据情有独钟。如果你要问这和天气有关吗?其实我主要想谈一些我认识到的 关于天气数据的有趣应用:金融行业。我很尊敬金融,主要是因为有些人做了一些疯狂的事情。我听说过中微子的应用实际上是 “因为金融”。你的算法可以解决购买印尼芝麻种子期货问题吗?有了天气数据,也许就可以。



32. 如果你想了解 食物的营养数据,美国农业部可以为你提供数据。你可以开发一个判断用户是否类食物过敏的手机APP。然后说服学校给每个学生购买这个APP。


33. 想精通语言,字典必不可少,但谈到 单词数据,没有什么字典比WordNet更优秀。WordNet侧重于语言的结构,这点其它字典无法比拟。


34. NASA公布了 太阳系以外的行星数据集。买一个飞船,你可以飞到那里建一个秘密基地。


35. 联邦铁路管理局有“ 关于铁路事故和意外的安全信息,库存和穿过的高速公路数据”。一些组织(如纽约时报)可以通过这些数据判断贫穷地区的人们是否更容易发生火车事故等。



36. 如果你需要关于 图书的数据,你可以到Open Library下载免费的数据集。


37. 美国的无人机杀害了谁?如果你 对巴基斯坦地区感兴趣,你可以查看这个数据集


38. 如果你想通过自动导入引用数据构建Papers2的竞争对手,你可以使 用CrossRef的元数据查询


39. Mnemosyne是一个虚拟卡片应用,通过间隔重复辅助记忆。几年来,这个项目一直在搜索用户数据,现在 gwern公司同意将这些数据免费公开若干月。研究者们可以在这些数据上运行机器学习算法,了解更多关于人类记忆的信息。


40. 婚礼上邀请贾斯丁•比伯要花多少钱? Priceconomics网站列举了雇佣各种明星的价格。你可以借助这些数据计算流行度和价格的比率。


来源:CSDN

周末巨献:100+诡异的数据集,20万Eclipse Bug、死囚遗言等【一】
周末巨献:100+诡异的数据集,20万Eclipse Bug、死囚遗言等【二】
周末巨献:100+诡异的数据集,20万Eclipse Bug、死囚遗言等【三】
周末巨献:100+诡异的数据集,20万Eclipse Bug、死囚遗言等【四】
周末巨献:100+诡异的数据集,20万Eclipse Bug、死囚遗言等【五】
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Eclipse CLIPS Clip lips PSE 软件工程师 柏拉图 机器人 科学家 数学家

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 00:40