楼主: haoli1991
11036 15

[学习分享] 论SAS,R, Matlab, 和Stata [推广有奖]

  • 1关注
  • 1粉丝

讲师

21%

还不是VIP/贵宾

-

威望
0
论坛币
133 个
通用积分
116.6265
学术水平
9 点
热心指数
9 点
信用等级
7 点
经验
10763 点
帖子
465
精华
0
在线时间
453 小时
注册时间
2010-8-10
最后登录
2025-12-24

楼主
haoli1991 发表于 2014-3-23 04:32:59 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

如下是我自己总结的各软件应该如何使用:

1.      SAS: 用于处理海量数据,当数据上百万,千万的时候R和 Matlab就已经很难再胜任。个人觉得主要原因在于:Matlab, R 读取的数据都放在内存里,一旦数据过大就会导致处理速度变慢,尤其在笔记本上跑的时候。而SAS读入的数据都存在临时文件夹里,只有在执行语句的时候才把对应的数据调出来,所以内存管理很有效。SAS还有一点很好的地方在于:逻辑库的运用。数据集都是用Table 保存的。我自己在做研究时,最初的原始数据集都偏向用SAS处理。各个变量和数据来源都呈现得很清晰。不过我个人不喜欢用SAS做分析,感觉语言太繁杂,不直接。平时用最多目测就是SQL 功能

2.      R:我用R的原因包括:1)涉及字符处理我都用R,感觉比SAS,Matlab方便,尤其是在用数据框结构时,比Matlab 处理得快很多。2)统计测试较全, R的包很方便,做初步测试的时候很便捷。Matlab 的包就很麻烦,的自己手都添加 3)我觉得最重要的还是,R读取的数据格式叫广泛,我有些数据用SAS, Matlab读出来都有问题,不过用R读,效果就很好。

3.      Matlab : 如果数据是纯数字类型的,我首选Matlab。做模拟实验,或者数值算法,尤其是蒙特卡洛模拟,它都是首选。例如在做有关衍生品定价方面的研究时,用Matlab 就很方便。

4.      Stata: 我觉得做研究的话,Stata的统计分析已经很全了,尤其是做计量经济学。我一般做研究的时候喜欢先用R或者Matlab做测试;等思路基本通顺后,就改用Stata. 目前写的Paper后面的所有表格基本都是用Stata生成的,很方便。


希望以上内容能对各位有所帮助


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:MATLAB atlab matla Stata tata 笔记本 文件夹 字符串 如何 软件

已有 1 人评分经验 学术水平 热心指数 信用等级 收起 理由
niuniuyiwan + 60 + 5 + 5 + 5 我很赞同

总评分: 经验 + 60  学术水平 + 5  热心指数 + 5  信用等级 + 5   查看全部评分

沙发
zxn2011 发表于 2014-3-23 04:40:11
个人感觉sas用于处理海量数据时似乎不太适合在windows系统的pc上使用,除非计算机性能特别优良,在linux下应该有更大的用途,毕竟sas是从硬盘上读取数据如果计算机配置不是特别理想,基本一Run就死......

藤椅
haoli1991 发表于 2014-3-23 05:25:22
zxn2011 发表于 2014-3-23 04:40
个人感觉sas用于处理海量数据时似乎不太适合在windows系统的pc上使用,除非计算机性能特别优良,在linux下应该 ...
学习了,多谢!

板凳
lonestone 在职认证  发表于 2014-3-23 07:04:47 来自手机
牛,分析到位

报纸
eweb2009 发表于 2014-3-23 07:42:43
很有帮助的总结。收藏了,多谢。

地板
zxxsm 发表于 2014-3-23 07:51:21 来自手机
受教了,谢谢!

7
bridge1989 发表于 2014-3-23 12:13:22
学习的榜样啊 我才刚接触SAS啊

8
zxn2011 发表于 2014-3-23 22:29:32
haoli1991 发表于 2014-3-23 05:25
学习了,多谢!
过奖了,只不过一点小体会.我用我的笔记本电脑-美版Y510P,8G内存,不好但也配置不算是特别差的了.跑跑一般的simulation还是足够的.处理一个数据集,也不算很大,5个variables,将近31万个observations,文件不到6M.用sas,不要说做分析,连个 Proc print;where;run;都玩不起来,用R就快得多了.我还专门到网上查过据说就是因为我上面说的原因.

9
xiao苏苏 发表于 2014-3-24 09:57:21
谢谢分享~~~~~~~~~~~~~

10
jingju11 发表于 2014-3-29 10:25:15
zxn2011 发表于 2014-3-23 22:29
过奖了,只不过一点小体会.我用我的笔记本电脑-美版Y510P,8G内存,不好但也配置不算是特别差的了.跑跑一般的 ...
让人难以理解是你为什么要打印出31万条记录呢?
京剧

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-27 06:58