楼主: 资料狂人
6480 15

[孙志猛] 央财统计与数学学院孙志猛 (R金融商务, 大规模数据分析) 8月19日在线访谈  关闭 [推广有奖]

11
Jemm-SUN 发表于 2016-8-19 15:40:26
weinamaleny 发表于 2016-8-18 09:53
请教孙老师R语言进行金融商务案例分析的优势是?
要说开源还有Python,要说强大有SAS,还有金融业常用的MA ...
您好,个人认为一项优秀的数据挖掘工作更多地依赖于负责人对业务的深刻理解和基于业务的量化建模能力,数据分析软件只是实现负责人想法的工具,不同背景的人喜欢用不同的工具,目前的几种分析软件如SAS,R, PYTHON,MATLAB等都有方法可以实现数据建模的目标。具体到数据分析软件各有特点,SAS分析功能强大,对大规模数据的处理能力也教强,但是其费用较贵,难以大规模推广;python处理大规模数据也具有一定的优势,但是其统计分析功能尚显薄弱;R统计分析非常强大,用起来非常方便,尤其是对非数理专业的人员更具吸引力,但是其处理大规模数据的能力相比较弱,但是对超大规模数据的分析建模可以先用一些比较基础的语言如JAVA对数据清洗,对清洗后的数据再用R建模分析,这也同样可以处理实务中遇到的大多数问题。所以,软件的选取没有固定的标准,适合自己的就是最好的。

12
Jemm-SUN 发表于 2016-8-19 16:02:16
lzguo568 发表于 2016-8-18 15:59
请问孙老师,请举几个国内公用事业大规模数据分析的实例,整体计算架构,算法及实际效果。有没有失败案例?
数据是上帝留下记号,更多的是记录“过去”的记号,所以数据不能解决所有问题,甚至对许多问题无能为力。但是数据越丰富,我们借助这些记号还原和发现事实的能力也就越强,也就能够解决一部分我们关心的问题。现在信息技术手段的进步,使得我们越来越便利地收集到大量的数据,因此利用数据解决以前不容易解决的问题成为可能。但是数据分析是一向复杂的工作,甚至有许多“陷阱”,因此,我们也很容易看到许多失败的案例。就国内公用事业而言,我所了解的在教育、交通和医疗卫生有许多成功的案例,我们也主持了一些公用事业和企业单位的数据项目,项目方还是比较满意。

13
shmct 发表于 2016-8-19 16:03:21
孙老师,您好!目前金融风控大数据分析主要集中在个人信用风险分析上,国外成熟的模型也非常多。但企业信用风险大数据分析的模型好像特别少,很多也只集中在对财务数据的分析和研究上。您能介绍一些您觉得不错的企业信用风险大数据分析的研究方向和研究进展上吗?
已有 1 人评分论坛币 收起 理由
资料狂人 + 50 鼓励积极发帖讨论

总评分: 论坛币 + 50   查看全部评分

14
Jemm-SUN 发表于 2016-8-19 16:21:47
zhouguobin 发表于 2016-8-19 09:21
孙老师好,我是从事量化研究工作,也一直用r在处理交易数据方面,我以为r在统计分析方面是有着自己的优势的 ...
您好,非常理解您的感受!我们在数据项目中,基本是JAVA和R混搭。对比较基础的算法,我们和JAVA工程师合作用JAVA直接实现,比较复杂的只能是用JAVA和R对接了。
我平时最担心学生在一个统计和计量方法的思想没琢磨透的情况下去找个软件实现,非常容易出问题。因此建议先吃透你所用到的计量方法本身,如Engle-Granger检验等,在深刻掌握方法思想的基础上,也许你自己用R写个程序实现都不是什么难事了。

15
Jemm-SUN 发表于 2016-8-19 16:54:01
shmct 发表于 2016-8-19 16:03
孙老师,您好!目前金融风控大数据分析主要集中在个人信用风险分析上,国外成熟的模型也非常多。但企业信用 ...
您好,的确,传统企业风险控制的方法主要建立在财务数据和信用记录数据分析上,但是在具体的金融业务中,尤其在国内,基于财务数据的风险模型往往效果不能令人满意,一个公考的秘密是,在一些专业会计公司的帮助下国内企业(尤其是中小企业)的财务数据往往存在较大水分,这是基于财务数据的风险控制效果不理想的原因,这一点也在我们的项目中得到印证。可喜的是,随着信息技术的进步和信息系统的普及,企业的其他关键数据如运营数据、经营数据、甚至“关系”型数据等较能反映企业真实状况的数据被越来越多地收集,为企业信用水平的确定提供了较优质的数据基础,也使得开发新的信用模型称为可能。我想这会是未来企业信用评估的主要方向。我们的一些项目也在这一块做了尝试,效果令人满意。

16
Jemm-SUN 发表于 2016-8-19 16:55:57
时间关系,今天的交流就到这里了,感谢大家的提问!祝大家有个愉快的周末!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-1 04:44