楼主: jingju11
3971 24

[原创博文] sas之我见 [推广有奖]

院士

30%

还不是VIP/贵宾

-

威望
3
论坛币
10965 个
通用积分
5.0754
学术水平
452 点
热心指数
463 点
信用等级
347 点
经验
75629 点
帖子
1937
精华
1
在线时间
3428 小时
注册时间
2009-5-22
最后登录
2020-1-26

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我对sas的认识和学习心得:

宏还是哄?我没有耐心也无法专心致志地去阅读他人的代码,尤其是看起来很乱其实更乱的宏程序。说白了,我不理解诸始作俑者的意图。为了某个微不足道的目的,炮制出一遍免检的sas文章来,即在Google的目录上,堆出令人痛恨的文字垃圾来。我也想不通宏究竟会解析成什么样子,还有宏的quoting。。。在我的认识里,宏就是程序的简写或者是不坏好意的隐蔽。好像以前有人写朦胧诗(北岛算一个,还有用斧头劈妻子的顾城),第一遍是正常的句子,然后掐头去尾。只留下‘汪’来代表‘汪汪’,最后真相大白,就是犬也。

何谓效率?低成本高产出。我本人不在乎程序的效率,第一反正是自己用。好坏烂在俺自己的锅里。如果运行时间长,巴不得有时间喝杯茶呢。第二,对于一个应用者来说,最昂贵的总是人力成本。尤其是绝大数的程序实在没有推广之必要。效率只在重复之中才有意义。在我眼里,在一个诚实敢言的草头兵的眼里,比较sqldata step之优劣纯是吃饱了撑的。再者,I/o内存和cpu,本就是一锅粥,就不要瞎撇了。权衡再三,还是顾此失彼。

过程第一。许多人舍弃SAS的一些很好的封装的过程不用,转而用data step来自己编程以期得到某种满足和实现。很难理解。如果是搞统计的,为什么闲着没事儿不读读自由度是怎么回事,而把时间浪费在一行一行的无聊的程序上。SAS的短处是给你的自由度少,更何况我们这些可怜虫只是在观天的井里,费劲地开拓梦想里广阔的天空。这也是我下决心再把R捡起来的原因。R可以实现自己的想法,也不那么费劲。可SAS的好处是给你做好了美味佳肴,等着你去享用。我们却往往,沾着一双油乎乎的手,操起铲子,汗流浃背的抄起菜来。苦命啊。

Sas总是推陈出新。这两天在研究MCMC过程。真是一盘好菜,澄清了许多对bayesian算法的绝望。不是sas没有,是自己无知不晓得。概言之,如果是做统计的朋友们,如果还没有掉入坐井观天的泥淖,如果还有丝毫的抱负,就去试试如何用mean来求和,用freq来分类,用surveyselectsampling,用import来读文件,用MI来插值,用reg来武装你的面试。。。

IML无法有效的推广,枉自辜负了挺美丽的名字。交互式。。。我认为算是SAS的一个败笔。本人为例。线性代数之向量和矩阵的运算草稿纸都用了不少,简单的算法也学过不少。仍然觉得难以适应它的程式。需要的时候,总要花一个礼拜去熟悉代码然后编出很好笑的东西来。为何?不知道。反正是很别扭。其实用R,只是一个简明的function而已。我尚且如此,就别提那些偏向文的流行病专业了。银行业的同志除外。或许除外。

我喜欢SAS,因为我可以用它来实现很多统计任务,很传统很正规。我不喜欢sas,因为一旦我偶然需要一些它所不提供或者不擅长的东西,便束手无策。如同对视一位鸡皮鹤发的老妪,浑没有一丝儿青春能动的朝气和色彩。由此我隐隐担忧,sas的繁荣或许只是表象,暗流不仅仅是来源于能动的R,还有她自身的根深蒂固的保守和八面玲珑的圆滑。怪不得象牙之塔里那帮爷还有孙子们不得意它。它和奔放的学术之流是相抵触的。

不要依赖SAS。在悍马卖给了天府的同胞的时候,我就长叹一声,十年一声(觉)扬州梦,全在妓女的琵琶里。学点理论吧。当然不是sas运行的理论,是统计0和1的理论(0和1?)在karl。Pearson的眼里,好像全是连续变量和四个参数。曾经有多少人期待着把class写到ph reg过程里啊。我就是其一。中间经过了一个很愚蠢的tphreg的过渡,然后就灰飞烟灭了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:surveyselect Data step function Sampling Bayesian Google 学习心得 文章 程序

已有 6 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
ChanchanChicago + 1 + 1 + 1 观点有启发
hopewell + 1 + 1 + 1 精彩帖子
peijiamei + 1 + 1 精彩帖子
eijuhz + 100 + 5 精彩帖子
醉_清风 + 1 + 1 精彩
crackman + 1 好的意见建议

总评分: 论坛币 + 100  学术水平 + 9  热心指数 + 5  信用等级 + 2   查看全部评分

本帖被以下文库推荐

沙发
crackman 发表于 2010-5-11 12:36:12 |只看作者 |坛友微信交流群
呵呵
jingju11大侠说的话很有道理
其实这也是最近一直思考的问题
如果有兴趣,可以用SAS base ,iml来解析所有的统计过程,只有自己去还原算法的原始过程,才能对PROC的过程,统计理论有更深的领悟和体会
胡良平的一本书,就是这样做,一面是讲统计理论,一面是用SAS来计算统计量,一面是用已有的PROC来实现统计分析的过程
不过每个人站的角度不一样,我想jingju11是搞统计出身的,是流行病学吗?对于医学数据或者流病数据分析来说,确实没必要去在乎STEP SQL的效率问题,因为数据量不大,而且建数据库的时候很多在数据处理和管理的问题在开始就可以规避,这也是数据仓库的重要性所在,例如新药研发搞了一个CDSIC标准,其实对建库有了一个很大的规范,但是在通信、金融数据方面我不知道有没有这些标准,国内似乎没有看到过,所以数据就很复杂,需要去处理,所以对于60G 100G甚至1T的数据量来说,不能不在乎效率,因为不同的效率有可能会让你减少很多很多的时间,节省成本。
另外从技术的层面来看,对于搞IT的人来说,记得有一个国内的SAS大哥跟我说,STAT真的那么管用吗?统计分析的东西就那么科学吗?其实这话我可以理解,因为他是搞IT,没有系统的学习统计,对统计的应用认识和我们存在一个很大的差异,他们反而是对技术很着迷,提高效率,这个也是计算机一贯的发展路线,最大化的利用资源。
至于JINGJU11大哥说的,R可以实现自己的想法, 这点我彻底赞同,但是我觉得SAS也是可以的,IML也可以做的到。
已有 1 人评分学术水平 热心指数 收起 理由
peijiamei + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

使用道具

藤椅
crackman 发表于 2010-5-11 12:46:51 |只看作者 |坛友微信交流群
还有一个问题就是
上次我和几个哥们在这个版面讨论过
STAT是SAS的核心
不能丢掉STAT

使用道具

板凳
simayuxier 发表于 2010-5-11 12:51:54 |只看作者 |坛友微信交流群
一个阶段是一个不道的风景,复杂到简单......简单到复杂.......到最后把自已的活最快忙完就行了.

使用道具

报纸
simayuxier 发表于 2010-5-11 12:53:35 |只看作者 |坛友微信交流群
一个阶段是一道不同的风景,复杂到简单......简单到复杂.......到最后把自已的活最快忙完就行了.

使用道具

地板
njtuwxt 发表于 2010-5-11 12:56:42 |只看作者 |坛友微信交流群
我感觉如果只学R,不用学Stata和sas应该都可以吧?
就像你会了latex,真的想做东西出来的时候,就不会再考虑word的一样,当然,matlab如果不考虑效率的话,也是不错的选择,习惯使用C的人除外。。
说了一堆的废话,实际上,真正想学牛人的,还是底层的东西好,吃别人嚼过的东西,毕竟不是那个味道,前几天学习eviews,感觉和spss差不多,多了个所谓的面向对象,呵呵,但如果真的搞东西呢,这些玩意matlab都能实现,甚至写起代码来更加简单(除了效率低一点),当然matlab是用c写的。。。
万物归宗啊~呵呵,程序,毕竟就是0和1,统计,最重要的还是通过表面发掘深层次的关系吧,而不仅仅是给出几个统计量就完了,这也应该是经济金融的人的长处,发掘现实社会的解释。。。
已有 1 人评分学术水平 热心指数 收起 理由
peijiamei + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1   查看全部评分

使用道具

7
njtuwxt 发表于 2010-5-11 12:56:58 |只看作者 |坛友微信交流群
我感觉如果只学R,不用学Stata和sas应该都可以吧?
就像你会了latex,真的想做东西出来的时候,就不会再考虑word的一样,当然,matlab如果不考虑效率的话,也是不错的选择,习惯使用C的人除外。。
说了一堆的废话,实际上,真正想学牛人的,还是底层的东西好,吃别人嚼过的东西,毕竟不是那个味道,前几天学习eviews,感觉和spss差不多,多了个所谓的面向对象,呵呵,但如果真的搞东西呢,这些玩意matlab都能实现,甚至写起代码来更加简单(除了效率低一点),当然matlab是用c写的。。。
万物归宗啊~呵呵,程序,毕竟就是0和1,统计,最重要的还是通过表面发掘深层次的关系吧,而不仅仅是给出几个统计量就完了,这也应该是经济金融的人的长处,发掘现实社会的解释。。。

使用道具

8
yuehuatian 发表于 2010-5-11 12:59:09 |只看作者 |坛友微信交流群
guo lu ,can guan xia
Nothing!!!
QQ:549254781

使用道具

9
poemnic 发表于 2010-5-11 13:48:46 |只看作者 |坛友微信交流群
热爱生命,那首诗不错。

使用道具

10
醉_清风 发表于 2010-5-11 13:54:50 |只看作者 |坛友微信交流群
热爱SAS 所以希望高手多多分享经验及心得
从来不需要想起 永远也不会忘记

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 02:42