楼主: ziyenano
5773 11

[原创博文] SAS与工作 [推广有奖]

  • 0关注
  • 52粉丝

院士

7%

还不是VIP/贵宾

-

威望
2
论坛币
6137 个
通用积分
27.3565
学术水平
338 点
热心指数
326 点
信用等级
298 点
经验
57352 点
帖子
879
精华
1
在线时间
4132 小时
注册时间
2012-1-4
最后登录
2025-5-7

楼主
ziyenano 发表于 2012-8-14 16:59:46 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

    不知不觉使用SAS几年了,随着对SAS的了解,慢慢的有了一种割舍不掉的情感。

    楼主学的是统计,学院开了一门概率统计建模课程,最初多半是用用STAT模块,常用的一些过程步敲得还算凑合,学习系统的SAS语言,纯属兴趣的事情;     
      
由于大四没什么课,大三暑假找了一家搞通信公司实习,做数据挖掘,其实中国的数据挖掘只能说在起步阶段,当然一些大公司除外,像华为,中信,或者国有银行(通常在省行)早就有数据挖掘部门了,多数公司还是在初始阶段,总体来说,整个行业还是走上坡路的,看看北上广开出的工资,确实诱人呐。不过楼主才干了一年多,还得再熬两三年!扯远了,扯远了...     
      
和老板胡侃一通,说是精通SAS(现在看来,真是无知者无畏啊,汗颜!!!)不过老板觉得还行,开了一份不错的实习工资,大四拿工资当生活费,蛮滋润的。     
      
进了公司打了快一个月酱油,陆陆续续开始干一点活了,偶尔能做做预测之类的,不过更多的是干数据库的活,事不多,敲敲sql,楼主大学学过VFP,其它都忘了,还好sql没忘;剩下来的时间在网上找一些资料,有时候用公司的数据自己做点东西,还蛮自娱自乐的;当时公司只有我一个做数据挖掘的,也算比较特殊,有时候提点建议,领导不懂,听完就放一边了,没办法,人微言轻呐!等时间长了,有一点发言权了,提点模型理念什么的,领导会觉得不错,让我自己做点成果出来,也算是正式入行了。     
      
一直干到毕业前一个月,回去写论文,平心而论,这十个月的时光对自己磨砺非常大,不管是SAS还是统计,都有了明显提高,当然再也不敢说精通SAS     
      
论文答辩完,辞了以前的工作,去找工作,还蛮轻松的。
    现在的公司,搞电信行业的;公司用的正版的SPSS Clementine,大概花了一个多星期熟悉一下软件,上手还算快,SPSS的东西怕是只有这么一个优点了。(以前也想过学R,宿舍一保研的哥们(理论自然高出咱不少了),之后用了R,跟我讲R怎么好怎么好,灵活,开源等等,就是对理论要求比较高;说得我都心动了,后来想想,就自己这水平,最多就能看懂算法,照着书用matlab或者iml敲点矩阵运算;用R的话,估计也是调用别人写的包,既然是调程序包,还是SAS)
      
现在处理工作,前期数据准备,探索还是用SAS,毕竟顺手的多;直到最后建模的时候扔给SPSS,谁叫人家是正版的!

    前几天遇上一件很疼的事情,领导丢给我一个问题,分析之后,转化成一个二分类的问题,提高判别命中率,只是无奈变量太少啊,原先只有一个,去倒腾明细表,好不容易变成了4个,情况依然很烂。试了logistic,结果不容乐观,把变量倒来倒去,也未见好转,试试判别分析,还是差不多。我想要不加点数据量吧,我跟负责数据库的领导商量,能不能多弄点数据,领导说不可能,这300多个数据跑出来,差点把服务器跑挂了,提取规则太麻烦,好好用着吧。
      
实在没办法,试试非参数的方法吧,非参数判别分析(真不懂非参数判别分析,看了半天帮助文档,零星懂了点K近邻方法,再次可悲自己的英文),效果真不一样,命中率提高了不少;寻思着,跟领导商量商量,领导说不错,Clementine能不能做?我说SPSS都未必有,更别说Clementine了。这下领导纠结了,不可能为了这个花几百万买个SAS license啊,想个办法折中一下。导成PMML?看看帮助文档,只有EM中几个模型支持输出,也没有非参数方法啊!我说要不用matlab编一个,想想不对,matlab也要收费,用C?就我这水平,开什么玩笑。
      
最后想到了R,免费的R,可咱不会啊,而且有没非参数判别分析的包还不知道?不过看到过Rgam(广义可加模型)的包,先用SAS中的gam拟合非参数logistic回归,效果不错,心想着总算有望,跟舍友商量商量,研究几天,好教教我用R来拟合;把这个事情先糊弄过去。

    最后想来,觉得以后有必要学一下R,多一门手艺总归没坏处,不过最好还是找个提供正版SAS的公司,毕竟这才是自己的最爱。fighting               

                                                
        









二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:clementine logistic回归 clementin logistic Fighting 公司 国有银行 中国 课程

沙发
stormhoof 发表于 2012-8-14 17:32:47
新人来学习经验,刚工作,只用到sas,sql做些简单的事情,希望以后能学到更多东西。

藤椅
zhou.wen 发表于 2012-8-14 22:21:28
一般教科书都是是距离判别或者Fisher判别,非参数判别是用核估计或者是k临近原则,效率会高很多,不知道楼主有没有去研究它的具体算法。而且k和r的取值不同出来的结果也很不一样
Practice Is The Best Teacher!

板凳
ziyenano 发表于 2012-8-14 23:52:08
zhou.wen 发表于 2012-8-14 22:21
一般教科书都是是距离判别或者Fisher判别,非参数判别是用核估计或者是k临近原则,效率会高很多,不知道楼主 ...
距离判别,bayes判别,典型的fisher判别以前多元统计都学习过,算法也比较清楚;核估计,K近邻法,在看非参数回归时候,研究过。非参数判别,知道有,但没有认真研究过, 这次也是没有办法的办法,临时想到了就用了;只是看了看大致的思想,还没来得及细细研究。如果zhou.wen兄能有好一点中文资料,希望能发我一份,目前的英文水平看帮助文档,着实吃力。

报纸
zhou.wen 发表于 2012-8-15 09:26:50
ziyenano 发表于 2012-8-14 23:52
距离判别,bayes判别,典型的fisher判别以前多元统计都学习过,算法也比较清楚;核估计,K近邻法,在看非 ...
非参数判别模型.pdf (254.07 KB)
你看下这个有没有帮助,这方面的中文文献好像比较少,应该是跟非参数回归比较类似的
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
ziyenano + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

Practice Is The Best Teacher!

地板
sunset1986 发表于 2012-8-15 09:27:14
学习了~
An honest tale speeds best being plainly told.
Cheers!

7
ziyenano 发表于 2012-8-15 09:52:53
zhou.wen 发表于 2012-8-15 09:26
你看下这个有没有帮助,这方面的中文文献好像比较少,应该是跟非参数回归比较类似的
非常感谢~

8
wodematlab 发表于 2012-11-8 16:28:33
学习了~~~~

9
scarfacetony 发表于 2012-11-8 17:12:01
跟楼主学习一下……
看了这个视频,我于是有了进股市的信心!
https://bbs.pinggu.org/thread-2787427-1-1.html

10
kittyforever 发表于 2013-1-17 14:21:17
sas很强大

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-31 17:31