楼主: 资料狂人
5953 10

[其他学者] 央财统计与数学学院孙志猛 (R金融商务, 大规模数据分析) 在线访谈问答汇总 [推广有奖]

运营管理员

巨擘

0%

还不是VIP/贵宾

-

威望
9
论坛币
974827858 个
通用积分
41250.1287
学术水平
4617 点
热心指数
3402 点
信用等级
3620 点
经验
636804 点
帖子
9610
精华
140
在线时间
18215 小时
注册时间
2010-5-1
最后登录
2024-4-29

初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
孙志猛,理学博士,中央财经大学统计与数学学院副教授,硕士研究生导师

研究方向
1. 复杂数据分析
2. 计量经济建模
3. 大规模数据分析

工作经历
2011年7月至今  中央财经大学统计学院与数学学院教师

所授课程
1.数理统计学(本科生)
2.抽样技术(本科生)
3.非参数统计(本科生)
4.现代统计前沿(研究生)
5.回归分析(研究生)
6.应用统计案例选讲(研究生)

学术兼职与社会职务
北京大学光华管理学院商务智能中心教授团队成员

匿名评审
1. Journal of Applied Statistics
2. Journal of Statistical Computation and Simulation
3. Journal of Systems Science and Complexity
4. 数理统计与管理
5. 北京化工大学学报

孙老师9月R语言金融商务案例实战现场班:
https://bbs.pinggu.org/thread-4740813-1-1.html

问答汇总:
Q1: 坛友wuhui1018:
尊敬的孙老师,您好!由于自己本科数理背景,研究生,金融工程(金融衍生品定价)方向,对于大数据研究了解甚少,缺乏相应的知识结构支撑,但一直也想做一点大数据方面的实务工作,有几个关于银行大数据风险管理方面的初浅问题想向您请教下,还望您能详细解答一下。(1)针对银行大数据风险管理这个领域,您认为这个问题可以从哪几方面进行切入?(2)做大数据风控哪个语言或者软件比较适合(R, SAS, python)还是其它?(3)针对大数据风险管理或者大数据研究相关领域,还请您可以推荐一些入门级的参考文献或者书本。
孙老师,因为自己很想比较快速的了解大数据方面的知识或者方法,以便开展具体的工作,不知道孙老师您有一些什么具体建议?
先在此感谢孙老师的指导!
A1:
您好,我还是针对你感兴趣的几个问题逐条回复吧。
(1)任何数据分析和数据挖掘都是基于对具体业务的深刻理解,银行风险控制也不例外。所以,如果打算在银行风险控制领域做些工作,首先是了解目前银行风险控制的基本模式和基本流程,深入了解银行客户的风险点和风险特征,掌握基本的风险控制方法;其次是了解和掌握一些风险控制的理论模型,结合对银行客户风险特点的深刻理解,寻找能够量化的风险点,针对性地开发一些风控模型,对风险进行量化控制。这两方面也许是比较合适的切入点。
(2)数据分析软件各有特点,SAS分析功能强大,对大规模数据的处理能力也教强,但是其费用较贵,难以大规模推广;python处理大规模数据也具有一定的优势,但是其统计分析功能尚显薄弱;R统计分析非常强大,用起来非常方便,尤其是对非数理专业的人员更具吸引力,但是其处理大规模数据的能力相比较弱,但是对超大规模数据的分析建模可以先用一些比较基础的语言如JAVA对数据清洗,对清洗后的数据再用R建模分析,这也同样可以处理实务中遇到的大多数问题。所以,软件的选取没有固定的标准,找到一个用熟了就是的。
(3)风控是一项复杂和细致的工作,大数据风控也是也是相对较新的领域,限于笔者有限的涉猎范围,在市面上尚未在大数据风控方面比较系统和的书和教材。
(4)我想任何专业领域的学习都是一个逐步了解和积累的过程,可以从一些简单的模型开始,在学习中不断提升自己的数据分析和建模能力。
希望以上浅见能对你有所帮助,谢谢!

Q2: 坛友weinamaleny:
请教孙老师R语言进行金融商务案例分析的优势是?
要说开源还有Python,要说强大有SAS,还有金融业常用的MATLAB
A2:
您好,个人认为一项的数据挖掘工作更多地依赖于负责人对业务的深刻理解和基于业务的量化建模能力,数据分析软件只是实现负责人想法的工具,不同背景的人喜欢用不同的工具,目前的几种分析软件如SAS,R, PYTHON,MATLAB等都有方法可以实现数据建模的目标。具体到数据分析软件各有特点,SAS分析功能强大,对大规模数据的处理能力也教强,但是其费用较贵,难以大规模推广;python处理大规模数据也具有一定的优势,但是其统计分析功能尚显薄弱;R统计分析非常强大,用起来非常方便,尤其是对非数理专业的人员更具吸引力,但是其处理大规模数据的能力相比较弱,但是对超大规模数据的分析建模可以先用一些比较基础的语言如JAVA对数据清洗,对清洗后的数据再用R建模分析,这也同样可以处理实务中遇到的大多数问题。所以,软件的选取没有固定的标准,适合自己的就是的。

Q3: 坛友lzguo568:
请问孙老师,请举几个国内公用事业大规模数据分析的实例,整体计算架构,算法及实际效果。有没有失败案例?
A3:
数据是上帝留下记号,更多的是记录“过去”的记号,所以数据不能解决所有问题,甚至对许多问题无能为力。但是数据越丰富,我们借助这些记号还原和发现事实的能力也就越强,也就能够解决一部分我们关心的问题。现在信息技术手段的进步,使得我们越来越便利地收集到大量的数据,因此利用数据解决以前不容易解决的问题成为可能。但是数据分析是一向复杂的工作,甚至有许多“陷阱”,因此,我们也很容易看到许多失败的案例。就国内公用事业而言,我所了解的在教育、交通和医疗卫生有许多成功的案例,我们也主持了一些公用事业和企业单位的数据项目,项目方还是比较满意。

Q4: 坛友zhouguobin:
孙老师好,我是从事量化研究工作,也一直用r在处理交易数据方面,我以为r在统计分析方面是有着自己的优势的,但在交易系统对接方面,比较底层的开发兼容性还是比较差的,不知孙老师有没有这样的经验来交流一下,另外一个问题,我学数理统计的,在计量方面不太了解,能否简单介绍一下R在计量方面的包和应用,如Engle-Granger检验等。工作中需要比较多,走个捷径吧
A4:
您好,非常理解您的感受!我们在数据项目中,基本是JAVA和R混搭。对比较基础的算法,我们和JAVA工程师合作用JAVA直接实现,比较复杂的只能是用JAVA和R对接了。
我平时最担心学生在一个统计和计量方法的思想没琢磨透的情况下去找个软件实现,非常容易出问题。因此建议先吃透你所用到的计量方法本身,如Engle-Granger检验等,在深刻掌握方法思想的基础上,也许你自己用R写个程序实现都不是什么难事了。

Q5: 坛友shmct:
孙老师,您好!目前金融风控大数据分析主要集中在个人信用风险分析上,国外成熟的模型也非常多。但企业信用风险大数据分析的模型好像特别少,很多也只集中在对财务数据的分析和研究上。您能介绍一些您觉得不错的企业信用风险大数据分析的研究方向和研究进展上吗?
A5:
您好,的确,传统企业风险控制的方法主要建立在财务数据和信用记录数据分析上,但是在具体的金融业务中,尤其在国内,基于财务数据的风险模型往往效果不能令人满意,一个公考的秘密是,在一些专业会计公司的帮助下国内企业(尤其是中小企业)的财务数据往往存在较大水分,这是基于财务数据的风险控制效果不理想的原因,这一点也在我们的项目中得到印证。可喜的是,随着信息技术的进步和信息系统的普及,企业的其他关键数据如运营数据、经营数据、甚至“关系”型数据等较能反映企业真实状况的数据被越来越多地收集,为企业信用水平的确定提供了较优质的数据基础,也使得开发新的信用模型称为可能。我想这会是未来企业信用评估的主要方向。我们的一些项目也在这一块做了尝试,效果令人满意。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据分析 问答汇总 在线访谈 大规模 Statistical 在线 商务 数学 统计 学院

已有 6 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
我的素质低 + 100 + 1 + 1 精彩帖子
xddlovejiao1314 + 100 + 1 + 1 + 1 精彩帖子
guo.bailing + 100 精彩帖子
断想钩沉 + 100 + 1 精彩帖子
安然2016 + 100 + 100 精彩帖子
Captain-CUI + 100 对论坛有贡献

总评分: 经验 + 600  论坛币 + 100  学术水平 + 3  热心指数 + 2  信用等级 + 1   查看全部评分



沙发
benharper 发表于 2016-8-22 14:31:20 |只看作者 |坛友微信交流群
支持孙志猛老师~~~~~~~

使用道具

藤椅
Kamize 学生认证  发表于 2016-8-22 17:44:22 来自手机 |只看作者 |坛友微信交流群
资料狂人 发表于 2016-8-22 09:17
孙志猛,理学博士,中央财经大学统计与数学学院副教授,硕士研究生导师

研究方向
谢谢分享

使用道具

板凳
zhangyingjie 发表于 2016-8-22 23:13:21 |只看作者 |坛友微信交流群
多谢孙老师的在线答疑!

使用道具

报纸
安然2016 发表于 2016-8-23 13:59:22 |只看作者 |坛友微信交流群
多谢孙老师的在线答疑!

使用道具

地板
hscing 发表于 2016-8-23 14:51:37 来自手机 |只看作者 |坛友微信交流群
资料狂人 发表于 2016-8-22 09:17
孙志猛,理学博士,中央财经大学统计与数学学院副教授,硕士研究生导师

研究方向
лл

使用道具

7
cglee 发表于 2016-8-25 19:47:15 |只看作者 |坛友微信交流群
支持一下了

使用道具

8
跟着赶脚走 发表于 2016-8-29 16:10:14 |只看作者 |坛友微信交流群
谢谢分享

使用道具

9
charles2011 发表于 2016-8-30 21:36:52 |只看作者 |坛友微信交流群
学习,谢谢

使用道具

10
gxnnhsd 发表于 2016-8-31 22:46:51 |只看作者 |坛友微信交流群
支持支持

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-30 17:58