楼主: 资料狂人
8113 29

[其他学者] MATLAB与Python金牌讲师,申万金工高级分析师王小川在线交流问答汇总 [推广有奖]

VIP管理员

泰斗

56%

还不是VIP/贵宾

-

威望
9
论坛币
979091599 个
学术水平
4395 点
热心指数
3195 点
信用等级
3468 点
经验
551791 点
帖子
7244
精华
143
在线时间
11379 小时
注册时间
2010-3-18
最后登录
2017-10-24

初级热心勋章 初级学术勋章 中级学术勋章 中级热心勋章 初级信用勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章 特级信用勋章 特级学术勋章

资料狂人 在职认证  发表于 2017-6-7 08:56:01 |显示全部楼层
王小川,博士,申万金工高级分析师,经管之家MATLAB与Python金牌讲师。
关注神经网络、数据挖掘、统计分析应用领域,国内最大的MATLAB论坛管理员,近年在北京、上海、武汉等地举办多次数据分析与挖掘研讨会与培训,有丰富的实战技巧与培训经验,在申万金工负责舆情挖掘、因子测试与事件等方向研究。

曾多次参与Mathworks公司培训活动,近年在北京、上海、武汉等地举办多次MATLAB培训研讨会,有丰富的MATAB实战技巧与培训经验,其微博上的发布的MATLAB数据挖掘公开课程总点击量超过50万。哈尔滨医科大学卫生统计学硕士,同济大学经管学院博士,承担了部分研究生MATLAB课程的教学任务,积累了丰富的教学经验,在硕士与博士期间,参与发表了SCI论文6篇,核心期刊论文5篇,获得同济大学奖学金,精通各类统计学软件,参与编写《MATLAB神经网络30案例分析》一书,该书的升级版《MATLAB神经网络N个案例分析》将于近期出版,同时正在编写《MATLAB与数据挖掘》一书。


6月北京/远程Python量化投资:http://bbs.pinggu.org/thread-5529260-1-1.html
7月北京MATLAB初高级课程:http://bbs.pinggu.org/thread-4275284-1-1.html

问答汇总:
Q1: 坛友zhouguobin:
王老师,您好,根据您的介绍,我想了解一下舆情因子(主要在互联网爬虫)目前行业上是如何实的,数据来源于哪些网站,以及如何论证因子是有效的,如何运用到实盘中去。我自己的理解就是基于一定时间长度(分析周期)找出一些文本数据检验出股票收益率显著的文本词汇。但在如何应用实盘上不太清楚,据说每家公司不一样。
A1:
zhouguobin:
   你好,目前最多做股票量化的人做的还是alpha策略。阿尔法套利也称阿尔法策略,是指指数期货与具有阿尔法值的证券产品之间进行反向对冲套利,也就是做多具有阿尔法值的证券产品,做空指数期货,实现回避系统性风险下的超越市场指数的阿尔法收益。为实现阿尔法套利,选择或构建证券产品是关键,而股票多头跑赢的目标就是对应的指数!
   此类问题最主要的还是找到有效的alpha因子,不过alpha因子目前很难找,很多人把barra中的risk factor当成了alpha因子,比如市值,常年来小市值跑赢了大市值,叫大家都忘记了市值本身是风险因子来的。今年各种量化基金跑成翔,大概率与偏重小市值因子有关。
   舆情类因子目前多家基金公司与私募都有过尝试,比如百发,利用的是百度的搜索量,南方基金用的是新闻的点击量等等。基本上是与平台类公司的合作,当然也有不少人使用爬虫来自己爬取的,Python里很多包都支持,这都不是难事,自己建立个数据库,使用下NLP判断下行业与概念等等。你可以参考下我做的这个:http://market.nber.io/sws_gainian.html
   论证因子是否有效网上有N多现成的包,比如alphalens等,主要是看当期的因子暴露与下一期的相关性,IC值等等,当然也看换手率啊,各个分组收益啊,收益一致性啊等等。
    最后,应该说,舆情类因子没有太广泛运用于Alpha策略原因是目前大家还是搞不懂几点:
    1. 舆情是不是评论、新闻量多了,股价就会涨?
    2. 或者评论,新闻量增量?
    3. 先有舆情还是先股票异动?
    4. 在中国,舆情到底是正向指标?还是反应散户的反向指标?
    这些都需要考虑的。舆情因子万万千,不可以什么都拿来做alpha选股的。
    个人建议,仅供参考!


Q2: 坛友zengxia316:
Python零基础 量化零基础 可以学6月10号的课吗
A2:
没问题。四天课程,前两天都是教学Python的。后两天是量化,这个会确保每个人都能听懂的。

Q3: 坛友cheetahfly:
王老师,您好!想请教一下,我们在做量化过程中往往会遇到这样的问题:由于市场总是在变化,当一个模型或策略开始表现较差时(也许是失效),我们总是无法第一时间辨别,究竟市场是发生了结构性变化,还是仅仅发生了周期性变化。请问你们在实践中如何处理类似的问题?谢谢!
A3:
很好的问题,这种情况经常出现,需要具体问题具体分析,比如,市值因子今年年初的反转,让赚了这么多年小市值的量化的人直接懵逼,究其原因,还是需要看策略具体的应用条件,也就是量化需要与主动择时、行业轮动等合作,一起完成投资决策!

Q4: 坛友我是女生:
王老师,您好,之前学了您的Python课程,受益匪浅~
就您刚才所说,量化需要和主动结合,但是具体的结合是如何实现的?现在很多基金经理还是在搞主动的一套,如何更好的结合量化完成投资呢?
A4:
又一个非常好的问题,首先需要思考的是量化的特点。

量化强于主动的地方在于可以将投资过程中的一些决策模块化,方便在数据中找到规律,但也正是这个原因,导致了量化局限于数据的问题,量化往往是右侧交易,没有发生过,或发生次数少的,量化模型判断难度高。

量化在投资决策中的亮点为:

  • 提供更多的数据供参考,并可回撤
  • 量化结论为依据,量化组合为备选池
  • 对现有持仓做不同角度的监测
  • 盘后管理:风险控制和业绩归因
具体量化与主动的结合我在量化投资培训上还会在提,欢迎报名!

Q5: 坛友乔乔秋:
现在量化投资的趋势的通过机器学习来进行吗
机器学习模型在量化里的应用如何?
期待回复
A5:
量化模型中包括机器学习,但是并非全部。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。
送你一张机器学习的图:


机器学习有点在于方便,快速,但是缺点也明显,比如:
  • 可视化数据的方法   
  • 选择一个适合当前问题的机器学习方法   
  • 鉴别和解决过拟合和欠拟合问题   
  • 处理大数据库问题(注意:不是非常小的)   
  • 不同损失函数的利弊
模型的好坏可能就由一个变量或者指标是否有问题,导致别人赚钱你亏钱的,什么事情做到极致,还需要时间。

Q6: 坛友油麦菜花:
王老师好,久闻您大名
我是一个小散,总是亏钱,个人投资者如何选择合适的标的进行投资?很多投资QQ群该不该进啊?
A6:
QQ群还是能不进就别进,投资终归是自己的事情。
小散的心态要调整好,不要盲目跟风,做投资需要有自己的逻辑和判断。
另外A股市场很多时候是政策市,理解政治,懂政治,对投资绝对有帮助。
商祺!

Q7: 坛友飞花一地:
学习量化是不是要求编程能力很强?感觉非常高大上似的,想学,编程能力捉急
A7:
量化的人确实需要相当的编程能力,但也绝非恐怖的IT级别,主要是数据的获取、处理、清洗、建模与模型评价、部署等等。在行业里呆久了就知道怎么玩了。但是对市场一定是有感觉的,比如我问你,2017年哪个行业涨的最好?什么逻辑,需要你自己心里清楚。
好运!

Q8: 坛友lisahulisa:
计量用在量化上是否适合?感觉很多券商的报告都是追热点,很多人对券商的报告都是嗤之以鼻的,您怎么看?
A8:
券商报告这个确实参差不齐,有些纯方法的可以看下,计量中的时间序列确实应用不太多,很多计量上的模型也都是纸上谈兵,真正的投资用不上,并且投资的想法都是很朴素的,这不意味着简单,道理就在那里,看清楚你就赢了。

Q9: 坛友pq001:
王老师 您在金融行业多长时间了
金融行业到底咋样?赚钱如何?
求现身说法
A9:
金融行业确实对很多应届生有致命的诱惑,说实在的,是因为这个行业还有壁垒红利,所以大家都想进入。赚钱也很累,也需要点天赋和自己的感觉。
如想来,我正在招聘实习生,有留用机会,欢迎投递简历!

Q10: 坛友bj007:
学了四天,我到底能学到啥?
A10:
1 Python的基础操作
2 Python的数据处理高级操作
3 量化投资概念
4 量化投资特点
5 量化投资实现:股票、期货等
6 策略评价
主要的思路是这个,供您参考。

Q11: 生如夏花绚烂:
王老师,您更偏向价值投资还是成长类的投资?
A11:
价值与成长一直都是投资界的话题,价值股有价值自不必说,而成长股一般也得选有价值的才会有人投资,否则,就不是理性投资者。
成长股是指因某一生产要素领先而形成垄断,并且有持续成长潜力的股票,通常需要不断进行评估,美国著名投资大师彼得·林奇就喜欢这类股票,在中国,王亚伟先生相对的比较喜欢这类。如,一些创业板等。
而价值股一般都是因为具备某项领先的竞争力从而形成垄断,并且公司一般已经停止增长,进入稳步发展时期,且规模很大,一般给投资者带来稳定回报的公司。
两者兼顾,最好!或者在不同的市场状态下,选择不同类型的股票。供参考!

Q12: miawang01:
请教您金融的数据如何获得?
A12:
上次Python的课程上还有人说TB180元买了2003到今天的日度行情数据,很多数据互联网上都有免费的,比如tushare,通联数据等等。目前,如果你不是行业内部人员,也是用很厉害的平台给你提供数据与策略模板的,只要你肯学,数据绝对不是你学习的障碍。

Q13: 坛友zcquant:
王老师您好.
平时在用spyder的时候, 刚一打开, 就发现变量列表中有变量存在, 如:pi, gamma什么的...
想把这些变量删除掉.
python是否有删除所有变量的函数呢? 然后再用gc.collect()清理下内存.
想类似于matlab中, 一开始的clear all; clc之类的命令语句.
谢谢~
A13:
%reset
这个魔法语句在ipython console中可行.. .但是不能用于python中...请问python有专门的命令吗
Spyder打开的时候,在variable explorer里将exclude private reference勾选。
你说的是不的del....

Q14: 坛友番茄爱吃鱼:
好奇零基础可以学吗?
A14:
你要说靠着四天直接能去入职不敢说,但是去实习是足够足够的。

Q15: 坛友紫梦蓝炫:
王老师,您好,我现在正接触数据行业,感觉分析能力欠缺,且没有数据分析技术,之前了解过power BI,Python,都想学习并能运用好,请问,对于初级级别的我,应该需要看哪些书,Python相关从初级到熟练我又该怎么做,看那几本书,麻烦王老师给予讲解,谢谢
A15:
Python相关从初级到熟练这个需要时间,初级的话,看看书,做做题就好,熟练的话需要项目跟着才知道,就跟你说的数据行业一样,需要自己从头到尾走一遍才知道怎么玩的。
书的话推荐《利用Python进行数据分析》

Q16: 坛友qwirt:
最近想学matlab,自己下载了该软件,发现很难,主要是用来解决论文书写中一些理论模型的数学运算,可自己是零基础,数学基础也相对薄弱,不知是否可以学会?请老师解答,谢谢
A16:
MATLAB真心已经不难了,尤其是MATLAB的帮助,非常系统,只要耐心的看下去,一定能看懂的。

Q17: 坛友长松3:
王老师好!18年应届硕士,本硕都是数学统计学,也在券商资管FOF投资部门和基金公司量化投资部门做过实习。
做的事情就是做一些金融数据分析回归之类的,看研报重复策略,但觉得自己还是能力不够。
请您指点下我应该继续往哪个方向努力呢?另外您对金融行业量化相关的职业选择有什么指导呢?
今年的行情马上要找工作是不是要哭一哭,麻烦王老师,谢谢!
A17:
今年的量化前景确实不乐观,市值因子的反转导致了非常多的量化基金回撤。
只做回归可是远远不够的,尽量多的接触各种策略,包括机器学习等。
职业选择的话,我个人倾向于先来卖方学习锻炼。

Q18: 坛友太史公:
王老师,您好,请问智能创投也是量化投资的一种吗?学习这个,需要掌握哪些机器学习的知识呢,机器学习和数据挖掘是一个概念吗?零编程基础的话,是学Python还是MATLAB,或者R呢?谢谢回复!
A18:
都是概念上的问题,智能创投目前不单单是仅在量化投资领域有应用,并且智能创投目前的应用炒作嫌疑比较多。
机器学习是数据挖掘的方法之一,也有其他数据挖掘方法。
零基础直接推荐Python。

Q19: 坛友710471301:
王老师想问一下读个金融或者金工博士对于去券商及基金就业有帮助吗?年龄比较大,35岁毕业的话,以前没有这方面的工作经验,都是银行的,本硕都是经济大类但是非金融……
A19:
这个说实在的,比较难。现在卖方买方都呈现越来越年轻化趋势,尤其没有工作经验的,还没有人介绍,难。



Q20: 坛友Crsky7:
王博您好,饭团版主从前经常向我提到您,因此久仰大名!在您的指导下,他的编程技术突飞猛进,一毕业就留在了天风自营,击败了各路名校的竞争对手。我就比较菜一些,目前在一家金融科技公司里面做量化策略,开发智能投顾系统,严格意义上不算金融行业人士。
俗话说得好,内行看门道,外行看热闹。最近智能投顾比较火,我们IT人员也想凑凑热闹。我们正在开发一款股票端智能投顾,致力于将卖方报告转化成买方报告,然后做成科技产品提供资讯服务。我主要负责资产配置,下面人负责择时和选股,用的是机器学习算法。我做资产配置主要基于经典的投资组合理论,自上而下选股,先做行业&现金配置,再做行业内个股配置。正因为我不是专业的投研人员,所以在模型开发中有很多困惑的地方得请教王博:
1、资产配置模型一般都需要估计资产的预期收益率,之前做基金端智能投顾的时候用历史收益率效果很好,但在股票端效果很差,是不是因为股票市场和基金市场的价格形态存在差异呢?莫非基金市场动量效应比较显著,股票市场反转效应比较显著?你们研究所有没有做过这方面的实证研究?
2、资产配置模型成功的关键就在于对资产未来收益率和相关性的准确估计,这当中经典马科维茨模型的假设存在严重缺陷,所以需要引入Black Litterman模型对收益率等进行修正,其中会用到分析师一致预期,这部分数据如何爬取和挖掘?
3、资产配置不是一劳永逸的事,投资组合需要根据市场状况(不)定期再平衡,这就涉及到调仓算法,目前市面上有哪几种比较好用的调仓算法?阈值如何来设定?如果在调仓过程中,原有股票正处在停牌或跌停的状态怎么处理?
4、无论是在调仓算法中设置阈值还是在资产配置模型中设置约束条件都不可避免地需要用到人为设定的参数,如何在优化这些参数的同时避免过度拟合以及数据窥视偏差?
5、在做历史回溯的时候,股票名称、行业、ST状态的变化会对资产配置结果造成影响,一律用最新的股票基本信息来做回测肯定结果是不真实的,那如何在模型回测中考虑这些历史变化?
6、最后一个问题比较大,也涉及到我们的宗旨:如何在量化策略中加入各种交易细节,将纸上谈兵的卖方策略转化成切实可行的买方策略?MATLAB和Python在大数据研究和实盘交易领域孰优孰劣?
问题可能比较多,也提得非常业余,希望能得到王博的耐心指点,非常感谢!
A20:
7版主好:
   资产配置自上而下没有问题,先解决大类,然后是行业,最后才是个股。
1. 并没有做此类研究,我觉得你需要看是什么基金吧,另外,股票市场波动大,如果是对冲基金的话,肯定不会用这么大的波动,也就是有一定的动量;
2. 分析师一致预期数据其实各家都有做,Wind,通联等,做的最好的是gogoal(朝阳永续),时间、所在单位、分析师个人三个维度加权分析师预期。
3. 没太看懂,你是说最简单那种比如格雷厄姆的50:50股票债券组合,当股票涨时,卖掉一部分股票买入债券保持股票5成的比例,而股票跌时,卖掉一部分的债券买入股票,这样动态平衡的好处在于可以一定程度上做到资产的高卖低买么。调仓股票处于停牌或者跌停是经常遇到,可以等能交易的时候再买或者下一个调仓日在处理。
4.都是好问题,哈哈,各种模型都有参数,参数设置多少,我觉得需要做到:1 参数含义的深入理解,根据当前市场状态来定义参数 2 参数优化,比如GA PSO搞起。
5. 这是回测平台要做的事情,这个不难,前提是取到当时股票的行业等,在程序里想到,我觉得你能编出来。
另外,SWS行业确实变动比较大,比较尴尬,用Wind行业吧。
6.一个好的团队需要的三类人:策略、交易、IT,策略负责测试各种想法,回测可用,虚拟盘OK的策略考虑进入交易环节,IT主要做数据库等技术支持,卖方策略确实很多都在纸上谈兵,转化需要理解策略,并且顺利连接自己的交易系统,股票PB,期货CTP等,实盘不会用MATLAB或者Python搞的,都是JAVA和C++。另外,大数据研究推荐Python,Theano,tensorflow对Python支持好。
个人观点,感谢信任,欢迎交流。



支持楼主:购买VIP购买贵宾 购买后,论坛将把您花费的资金全部奖励给楼主,以表示您对TA发好贴的支持
 
载入中......
已有 5 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
xujingtang + 100 精彩帖子
chengzhifu2013 + 100 + 5 + 5 精彩帖子
accumulation + 100 + 1 + 1 + 1 精彩帖子
xddlovejiao1314 + 100 + 5 + 5 + 5 精彩帖子
aclyang + 40 精彩帖子

总评分: 经验 + 400  论坛币 + 40  学术水平 + 11  热心指数 + 11  信用等级 + 6   查看全部评分

本帖被以下文库推荐




stata SPSS
sapi 发表于 2017-9-24 13:00:47 来自手机 |显示全部楼层
好!
回复

使用道具 举报

marcus10 发表于 2017-7-28 22:32:37 来自手机 |显示全部楼层
资料狂人 发表于 2017-6-7 08:56
王小川,博士,申万金工高级分析师,经管之家MATLAB与Python金牌讲师。
关注神经网络、数据挖掘、统计分析 ...
支持一下
回复

使用道具 举报

钱学森64 发表于 2017-7-24 21:21:16 |显示全部楼层
谢谢分享
回复

使用道具 举报

jimaocai 发表于 2017-7-15 20:46:07 |显示全部楼层
顶起来
回复

使用道具 举报

新月尘封 发表于 2017-7-9 17:05:29 |显示全部楼层
顶顶顶,不错不错!
回复

使用道具 举报

xujingtang 发表于 2017-7-6 20:21:18 |显示全部楼层
回复

使用道具 举报

雨田xzx 发表于 2017-7-6 09:19:51 |显示全部楼层
想学习一下
回复

使用道具 举报

karst 发表于 2017-7-4 18:35:38 |显示全部楼层
谢谢分享
回复

使用道具 举报

chengzhifu2013 发表于 2017-7-4 10:59:55 |显示全部楼层
Crsky7 发表于 2017-6-12 19:07
在FINTECH公司做QUANT,是不是很奇怪
不奇怪呀,金融高科技乃大势所趋,版主数理功底扎实大有可为,加上ai更是如虎添翼,所向披靡
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

GMT+8, 2017-10-24 19:30