楼主: Lisrelchen
15025 41

[大家來答題]数据分析师面试常见的77个问题   [推广有奖]

21
complicated 在职认证  发表于 2014-8-10 11:43:04
认领一个,尝试答一下:
9、你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好?

当你有“好”的数据的时候,就不需要太复杂的模型就可以得到很不错的效果。相反,如果数据不好,再怎么优化模型,加入复杂的算法,能得到的提升也很有限。
好的数据指:
定义清楚——拿电商的货品收入来说,你要知道它是标价还是折扣价,还是扣除了代金券积分之类后的实际支付
可持续——如果你要回溯2年的历史,最好先确定数据库里有那么久的记录,如果你要把一个变量引入模型,最好确定它将来还会被持续被关注;
稳健可用——金额的值从来波动巨大激动人心,但是在某些场合,支付次数比支付金额更稳定,也更有效

不会有在所用的情况下通用的模型,只有在一定场合下比较适合的几种模型。我也不认为哪些模型就是好和不好的,只有适合和不适合。
已有 1 人评分经验 论坛币 学术水平 收起 理由
Nicolle + 24 + 24 + 5 精彩帖子

总评分: 经验 + 24  论坛币 + 24  学术水平 + 5   查看全部评分

22
junliug 发表于 2014-12-20 23:24:38
It is quite difficult

23
青风沐月 发表于 2015-1-21 11:46:47
支持,顶起

24
lilywhr 发表于 2015-1-25 10:39:06
都不会呀

25
lacrimosadc 发表于 2015-4-27 20:11:56
看了这些问题,我觉得如果只会把程序编出来是远远不够的!要对软件有十分深刻的了解,这的需要多么深的羁绊啊!!!!!!

26
zrsun@live.com 发表于 2015-4-28 08:31:50 来自手机
好吧,学习了

27
jerker 发表于 2015-4-28 08:42:56
来个有奖征答

28
961938985 发表于 2015-4-28 08:45:06
呃,求答案

29
dongcei 发表于 2015-4-28 09:21:30
谢谢分享

30
lijizyong911 发表于 2015-4-28 15:53:46
不错

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-1 05:10