zhouguobin 发表于 2017-5-31 13:33
王老师,您好,根据您的介绍,我想了解一下舆情因子(主要在互联网爬虫)目前行业上是如何实的,数据来源于 ...
zhouguobin:
你好,目前最多做股票量化的人做的还是alpha策略。阿尔法套利也称阿尔法策略,是指指数期货与具有阿尔法值的证券产品之间进行反向对冲套利,也就是做多具有阿尔法值的证券产品,做空指数期货,实现回避系统性风险下的超越市场指数的阿尔法收益。为实现阿尔法套利,选择或构建证券产品是关键,而股票多头跑赢的目标就是对应的指数!
此类问题最主要的还是找到有效的alpha因子,不过alpha因子目前很难找,很多人把barra中的risk factor当成了alpha因子,比如市值,常年来小市值跑赢了大市值,叫大家都忘记了市值本身是风险因子来的。今年各种量化基金跑成翔,大概率与偏重小市值因子有关。
舆情类因子目前多家基金公司与私募都有过尝试,比如百发,利用的是百度的搜索量,南方基金用的是新闻的点击量等等。基本上是与平台类公司的合作,当然也有不少人使用爬虫来自己爬取的,Python里很多包都支持,这都不是难事,自己建立个数据库,使用下NLP判断下行业与概念等等。你可以参考下我做的这个:
http://market.nber.io/sws_gainian.html
论证因子是否有效网上有N多现成的包,比如alphalens等,主要是看当期的因子暴露与下一期的相关性,IC值等等,当然也看换手率啊,各个分组收益啊,收益一致性啊等等。
最后,应该说,舆情类因子没有太广泛运用于Alpha策略原因是目前大家还是搞不懂几点:
1. 舆情是不是评论、新闻量多了,股价就会涨?
2. 或者评论,新闻量增量?
3. 先有舆情还是先股票异动?
4. 在中国,舆情到底是正向指标?还是反应散户的反向指标?
这些都需要考虑的。舆情因子万万千,不可以什么都拿来做alpha选股的。
个人建议,仅供参考!