认领一个,尝试答一下:
9、你认为哪个更好:是好的数据还是好模型?同时你是如何定义“好”?存在所有情况下通用的模型吗?有你没有知道一些模型的定义并不是那么好?
当你有“好”的数据的时候,就不需要太复杂的模型就可以得到很不错的效果。相反,如果数据不好,再怎么优化模型,加入复杂的算法,能得到的提升也很有限。
好的数据指:
定义清楚——拿电商的货品收入来说,你要知道它是标价还是折扣价,还是扣除了代金券积分之类后的实际支付
可持续——如果你要回溯2年的历史,最好先确定数据库里有那么久的记录,如果你要把一个变量引入模型,最好确定它将来还会被持续被关注;
稳健可用——金额的值从来波动巨大激动人心,但是在某些场合,支付次数比支付金额更稳定,也更有效
不会有在所用的情况下通用的模型,只有在一定场合下比较适合的几种模型。我也不认为哪些模型就是好和不好的,只有适合和不适合。


雷达卡



京公网安备 11010802022788号







