A股市场做量化投资是最适合的,因为中国的市场还不是很有效。量化投资在找到规律了以后就从非有效性(Inefficiency)里获取高收益。我们在美国做量化策略的时候,越往后市场竞争就越厉害,做的人多,专业团队也多。一旦有获利机会,很快市场就会把这个机会平复掉。
在中国因为散户比较多,所以会造成市场非有效性(Market Inefficiency)的行为也特别多。我们在做专业量化投资的时候可以不断地捕捉这些非有效性。当然,中国市场肯定跟美国市场不一样,有很多自己的特点,所以美国的量化理论方法到中国来的时候要做一些本土化的适应。
造成市场非有效性的有很多原因。前年诺贝尔获得奖有三个人,其中一个叫Eugene Fama,他是研究市场有效性的。另外一个是耶鲁大学的Robert Shiller,他是研究行为金融学的。这两派在争论,Fama说市场是有效的,而Shiller说市场不是完全有效的,一些不理性行为会造成市场的非有效性。Shiller最经典的文章是他在80年代写的,其中提到市场定价是和每个股票的未来预期现金流相关的。预期现金流的折现就是股票现在的价格,如果未来预期现金流预测确定的话,今天的价格和明天的价格应该差别不大。
但是Shiller也说不是所有人都认可这个理论。市场情绪会影响大家对股票价格的判断,而情绪这个指标代表了所有的投资者。如果我们都是专业投资者,都用专业的方法研究股票,那么我们对股票价格基本会有一致的预期,而这个预期价格就应该和实际的价格非常接近。然而因为市场中有很多非理性投资者把股票价格抬高或压低,所以股价会根据市场情绪的波动围绕预期价格变化,这就体现出了股票市场的非有效性。现在中国市场在某种程度上就是一个被情绪影响的市场。很多股票应有的真实价格可能没有那么高,但因为市场情绪很高,就会造成像暴风科技这样股价奇高的公司。
不过这种现象每个市场都会有,美国也发生过。最典型的就是2000年的高科技泡沫,市场情绪把股价抬得很高,有些人就可以从大的行情上套利,在高点卖空。但是这样做的成本会比较高,因为需要等多久,而市场情绪能持续多久是不确定的。
至于量化适不适合中国市场,这是一个方法的问题,而投资其实有很多很多方法。主动基金经理用的方法是基本面投资,除了基本面还有量化的方法。未来的投资趋势更倾向于Quantamental(即“量化基本面分析法”),就是把量化和基本面两种方法有效结合起来,而这样的方法可能更合适中国市场,因为做基本面的人已经完全没有能力处理现在的这么多信息了。一家一家公司地去看报表然后再总结的话,办事效率和信息覆盖量都非常有限,所以必须要借助像大数据和自然语言处理这样的工具去帮助投资经理处理更多信息,最后得出一个决策,传统通过走访公司获取信息的方法已经行不通了。
举一个简单的例子,原来看基本面的基金经理如果要调研一家公司的运营情况的话,常用的做法是到这个公司的工厂的门口去看每天卡车的进出量,通过数卡车的进出量来评估这个公司的经营活跃度。但这样靠人工去收集信息只能抽样,因为一个人不可能24小时呆在一家公司门口。
而在现在这个大数据时代,我们可以用低轨卫星来拍摄各个地方的实际情况。比如用卫星来监测这个工厂门口的卡车进出量,就可以做到24小时不间断地获取数据。通过这样的高科技搜集信息,然后再用大数据的方法提取信息,我们就能获得非常好的数据样本,这样不需要出门就可以做公司运营情况分析了。这样看来,量化也是把一些原来基本面的东西,比如说人的思考方式和投资逻辑,量化以后变成一个模型,所以未来的趋势是将量化和基本面结合起来。
既然量化需要大量数据,是不是说只有BAT这样拥有海量数据的公司才能做量化呢?不一定。比如百度拥有最多的数据就是从各种网页上扒来的数据和网站信息,另外百度还有搜索数据,比如点击率,可以通过搜索数据给市场情绪做评估。比如如果大家都在搜平安,这就说明大家都对平安很关注,平安股票的热度就会起来。但这种数据对投资来说只能预期股票价格的短期变化。相反,我刚才讲的检测公司卡车的进出量的例子,可以推测出公司的长期表现。比如如果这个季度该公司的卡车量上升很多、活跃度很高,我们就可以预测公司这个季度出来的结果会比较好,从而预测了它的基本面。
另外,我们在看投资者的关注度或者情绪的时候还可以参考除了百度以外的其他很多数据,比如说电商数据也可以告诉我们企业的运营情况。再比如说比较复杂的天气数据,我们可以从其他地方拿到。所以我们希望帮助大家聚合各种各样的数据,包括百度、阿里、京东还有一些传统行业的数据,把它们聚合到一个平台上来,帮助投资者快速找到他们所需要的数据。
然而很多中国企业都有数据保护的倾向,海外的公司相对来说比较开放一些,比如Facebook已经开放接口,让其他公司可以用它的数据做分析。所以我觉得在保护用户隐私的情况下,中国公司开放数据只是一个时间问题,因为如果一家公司把自己的数据封闭起来了,其实它拥有数据的价值也降低了。很多大的公司已经开始逐渐开放,希望让更多的人用它的数据,挖掘数据的价值。除了大公司,市场上还有很多其他的数据提供商,比如现在有些创业公司也可以去扒互联网数据,它们做得不一定比百度差,因为它们是专业的数据挖掘,可以提供某一个领域(比如汽车)非常深度的数据。
来源:量化投资