首先讲一下自己的情况。
不做理论模型,stata reg monkey的感觉。菜狗一只。
有点儿疑惑。常用的数据大部分是统计数据或者问卷数据 。
个人觉得python中的pandas什么的就是移植的R的数据处理方式,相对而言,R比Python语法好像更简洁。。
然后,更简洁的是Stata。
大神们是怎么坚持用Python的。。就是我一个pandas都觉得麻烦。。
eg:
df['aaa'] = df.groupby(by = ['id','year'])['sth'].transform('np.max')
bys id year : egen = max(sth)
后者不是更简洁么?而且还可以有很好的代码提示(Stata 17 Standard Editiion)。
为什么还要用pandas呢?当然,用python去做ML的大神就算了。我感觉如果做计量,目前Stata完胜Python。是什么让大家用python的呢?我总感觉并没有优势呀。