楼主: 时光永痕
2607 0

[数据挖掘新闻] 你是数据艺术家,而不是数据科学家 [推广有奖]

  • 0关注
  • 14粉丝

svip3

学术权威

12%

(VIP/贵宾)五级

84%

威望
0
论坛币
26 个
通用积分
57.2086
学术水平
4 点
热心指数
4 点
信用等级
4 点
经验
34190 点
帖子
2733
精华
0
在线时间
321 小时
注册时间
2020-7-21
最后登录
2024-8-1

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
“数据科学家”在 2020 年代相当于 1950 年代的火箭科学家:神秘、性感、高薪。但你真的是“科学家”吗?虽然“数据科学”尚未完全定义为一门学术学科(美国国家科学院、工程和医学院,2018 年),但越来越多的证据似乎表明它更像是一门艺术,而不是一门科学。


你是毕加索,还是爱因斯坦?
所以,如果数据科学的本质还没有固化,我怎么能大胆地声明你是艺术家,而不是科学家?如果我们还不能就数据科学的核心原则到底是什么达成一致,我们可以看看它的主要组成部分:编程和统计——这两者都不是真正的科学。  

那么,编程不是一门科学吗?
著名的斯坦福计算机科学家唐纳德·克努斯(Donald Knuth)被纽约时报称为“硅谷的尤达”(The Yoda of Silicon Valley),他雄辩地驳斥了任何论据(如SNHU所引),

“计算机编程是一门艺术,因为它将积累的知识应用于世界,因为它需要技巧和独创性,尤其是因为它产生美丽的物体。”

但从不同的角度来看,这次来自加州大学圣克鲁兹分校电影与数字媒体系主任兼教授、艺术家 Warren Sack。Cruz 教授在本科时学习了计算机科学,并谈到了他在编程方面的经历(正如 UC Santa Cruz 的一篇文章中所引用的那样)。

“自从我攻读艺术课程的计算机科学专业本科生以来,对我来说,编写软件是一门艺术似乎很明显。”

统计学真的是一门科学吗?
这个有点棘手。自从圣经时代作为政府或州的统计员以来,统计已经经历了许多转变。关于统计学是否是一门科学的争论并不是什么新鲜事。早在 1978 年,M. Healy 在《皇家统计学会杂志》的文章中指出统计学 是一门科学吗?该统计数据“……最好将其视为技术而不是科学。”  随着时间的推移,它已经变形为一个学科的庞然大物,充满了“……各种相互矛盾的方法”(马克·范德兰,加州大学伯克利分校的生物统计学和统计学教授)。

撇开统计学本身可能是一种艺术形式的概念不谈,很明显它已被应用于众多度量领域(计量经济学、生物统计学、心理测量学……)所有这些领域,如果不应用统计方法,显然属于艺术。将统计数据添加到组合中,包括估计、测试和预测——会使水有点混浊,但算法的应用并没有神奇地将艺术变成科学。因此,如果您将统计数据视为一组可应用于艺术领域(以及技术领域,如计算)的科学工具,那仍然不能使统计数据成为“科学”。这就像把尺子、量角器和计算尺称为“科学”。定义科学的不是工具,而是支配你使用这些工具做什么的规则、法律和程序。是的,统计数据包含规则、程序和算法。但这也需要大量的猜测和创造力。说统计学是一门科学,因为它包含规则、程序和算法,就像说视觉艺术也是一门科学,因为它使用了技术、视角和比例。

考虑引用“艺术是执行某些行动的技能或力量......将原则的设置规则实际应用于实践”(Alagar,2009,第 4 页)。将“艺术”一词改为“统计”,这句话仍然有意义,因为它完美地描述了统计学家的角色:

“[统计]是执行某些动作的技能或力量……将原则的设置规则实际应用到实践中”。

科学方法和统计学都喜欢假设这一事实 也不能使统计学成为一门科学。假设是科学方法的支柱,没有它,科学就不会存在。统计数据也不一样:去掉假设检验,你仍然有大量不依赖于令人讨厌的 p 值的创造性和探索性工具:贝叶斯方法、探索性数据分析、趋势分析、描述性统计,仅举几例。

但是建模呢?
统计学对数据科学的最重要贡献之一是建模. 最好的情况是,建模是一种令人印象深刻且强大的技术,用于理解数据和进行预测。统计建模基于一组精确的规则,允许您将大量数据转换为可理解的、可行的模型。如果“科学是系统知识的主体……对某些事实的观察”(Alagar,2009 年,第 4 页),那么统计建模就是最好的科学。但是,有一个问题。在理想的世界中,建模背后的数学(以及科学)将被严格遵守。但是,如果您曾经花时间研究统计建模(如果您是数据科学家,您可能有),您就会知道遵守严格的规则和假设是具有挑战性的,而且很容易偏离笨拙的规则。统计学家也不总是遵守规则,

如果统计学家并不总是做对,那么作为数据“科学家”的你很可能也做错了——至少在这个词的技术意义上是这样。因此,如果您不遵循一套严格的规则,那么您就会变得富有创造力——因此,您可能是一名艺术家。

统计学作为一门文科
那么,如果统计学不是一门科学,那它是什么?  您可能会争辩说统计数据是混合的:

“因此,我们可以得出结论,统计既是科学又是艺术”(Alagar,2009 年,第 4 页)。

在他的文科统计中,  大卫摩尔认为它应该属于文科的范畴。

“文科通常被理解为一般和灵活的推理模式。根据这个定义,统计学可以称得上是一门文科,并且它被认为是一门学科的健康发展很重要。”

数据科学艺术,有人吗?
如果将标记为“数据科学”的数据点输入到分类算法中(基于上述“规则”),毫无疑问它会被归类为一门艺术。或者,如果您仍然持观望态度,并且想争辩说“数据科学”中还有一点科学,也许您可​​以称自己为数据科学艺术家?不像“数据科学家”那么性感,但也许更真实一点。

编辑推荐
1、2022年300个以上最佳免费数据科学课程
2、大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
3、机器学习模型方法总结
4、历史最全机器学习/深度学习/人工智能专业术语表中英对照表
5、机器学习如何应用于商业场景?三个真实的商业项目
6、数据工作者的自我修养 | 哪些技能是必不可少的?
7、《汗牛充栋:数据分析书籍分享》CDA网校新课上线
8、文本挖掘常用的107个语料库
9、一图读懂“东数西算”工程
10、零基础转行数据分析,看这篇文章就够了

DA内容精选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据科学家 数据科学 艺术家 科学家 silicon

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-17 14:53