搜索
人大经济论坛 附件下载

附件下载

所在主题:
文件名:  非参数判别模型.pdf
资料下载链接地址: https://bbs.pinggu.org/a-1160894.html
附件大小:
254.07 KB   举报本内容

不知不觉使用SAS几年了,随着对SAS的了解,慢慢的有了一种割舍不掉的情感。

楼主学的是统计,学院开了一门概率统计建模课程,最初多半是用用STAT模块,常用的一些过程步敲得还算凑合,学习系统的SAS语言,纯属兴趣的事情;
由于大四没什么课,大三暑假找了一家搞通信公司实习,做数据挖掘,其实中国的数据挖掘只能说在起步阶段,当然一些大公司除外,像华为,中信,或者国有银行(通常在省行)早就有数据挖掘部门了,多数公司还是在初始阶段,总体来说,整个行业还是走上坡路的,看看北上广开出的工资,确实诱人呐。不过楼主才干了一年多,还得再熬两三年!扯远了,扯远了...
和老板胡侃一通,说是精通SAS(现在看来,真是无知者无畏啊,汗颜!!!)不过老板觉得还行,开了一份不错的实习工资,大四拿工资当生活费,蛮滋润的。
进了公司打了快一个月酱油,陆陆续续开始干一点活了,偶尔能做做预测之类的,不过更多的是干数据库的活,事不多,敲敲sql,楼主大学学过VFP,其它都忘了,还好sql没忘;剩下来的时间在网上找一些资料,有时候用公司的数据自己做点东西,还蛮自娱自乐的;当时公司只有我一个做数据挖掘的,也算比较特殊,有时候提点建议,领导不懂,听完就放一边了,没办法,人微言轻呐!等时间长了,有一点发言权了,提点模型理念什么的,领导会觉得不错,让我自己做点成果出来,也算是正式入行了。
一直干到毕业前一个月,回去写论文,平心而论,这十个月的时光对自己磨砺非常大,不管是SAS还是统计,都有了明显提高,当然再也不敢说精通SAS
论文答辩完,辞了以前的工作,去找工作,还蛮轻松的。
现在的公司,搞电信行业的;公司用的正版的SPSS Clementine,大概花了一个多星期熟悉一下软件,上手还算快,SPSS的东西怕是只有这么一个优点了。(以前也想过学R,宿舍一保研的哥们(理论自然高出咱不少了),之后用了R,跟我讲R怎么好怎么好,灵活,开源等等,就是对理论要求比较高;说得我都心动了,后来想想,就自己这水平,最多就能看懂算法,照着书用matlab或者iml敲点矩阵运算;用R的话,估计也是调用别人写的包,既然是调程序包,还是SAS)
现在处理工作,前期数据准备,探索还是用SAS,毕竟顺手的多;直到最后建模的时候扔给SPSS,谁叫人家是正版的!

前几天遇上一件很疼的事情,领导丢给我一个问题,分析之后,转化成一个二分类的问题,提高判别命中率,只是无奈变量太少啊,原先只有一个,去倒腾明细表,好不容易变成了4个,情况依然很烂。试了logistic,结果不容乐观,把变量倒来倒去,也未见好转,试试判别分析,还是差不多。我想要不加点数据量吧,我跟负责数据库的领导商量,能不能多弄点数据,领导说不可能,这300多个数据跑出来,差点把服务器跑挂了,提取规则太麻烦,好好用着吧。
实在没办法,试试非参数的方法吧,非参数判别分析(真不懂非参数判别分析,看了半天帮助文档,零星懂了点K近邻方法,再次可悲自己的英文),效果真不一样,命中率提高了不少;寻思着,跟领导商量商量,领导说不错,Clementine能不能做?我说SPSS都未必有,更别说Clementine了。这下领导纠结了,不可能为了这个花几百万买个SAS license啊,想个办法折中一下。导成PMML?看看帮助文档,只有EM中几个模型支持输出,也没有非参数方法啊!我说要不用matlab编一个,想想不对,matlab也要收费,用C?就我这水平,开什么玩笑。
最后想到了R,免费的R,可咱不会啊,而且有没非参数判别分析的包还不知道?不过看到过Rgam(广义可加模型)的包,先用SAS中的gam拟合非参数logistic回归,效果不错,心想着总算有望,跟舍友商量商量,研究几天,好教教我用R来拟合;把这个事情先糊弄过去。

最后想来,觉得以后有必要学一下R,多一门手艺总归没坏处,不过最好还是找个提供正版SAS的公司,毕竟这才是自己的最爱。fighting














    熟悉论坛请点击新手指南
下载说明
1、论坛支持迅雷和网际快车等p2p多线程软件下载,请在上面选择下载通道单击右健下载即可。
2、论坛会定期自动批量更新下载地址,所以请不要浪费时间盗链论坛资源,盗链地址会很快失效。
3、本站为非盈利性质的学术交流网站,鼓励和保护原创作品,拒绝未经版权人许可的上传行为。本站如接到版权人发出的合格侵权通知,将积极的采取必要措施;同时,本站也将在技术手段和能力范围内,履行版权保护的注意义务。
(如有侵权,欢迎举报)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

GMT+8, 2025-12-31 19:46