楼主: lijiangwei
1448 0

中国股市为什么更适合做量化投资? [推广有奖]

  • 0关注
  • 0粉丝

本科生

38%

还不是VIP/贵宾

-

威望
0
论坛币
366 个
通用积分
0
学术水平
3 点
热心指数
4 点
信用等级
3 点
经验
689 点
帖子
37
精华
0
在线时间
77 小时
注册时间
2009-8-21
最后登录
2016-11-14

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

我们正在经历金融科技的一次大革命,信息储存成本逐年降低,宽带速度逐年提高,云端服务成本降低,服务规模加大,大数据处理算法和知识搭建不断提升。


数库CEO刘彦对此有个判断:我们已经从拥有数据的阶段进化到用数据干什么的阶段。


用数据能干什么呢?比如中国股市。


很多人都认为中国股市不规范。基于对于数据知识化的信心,刘彦断言:


中国股市比其他市场更适合做量化投资。


以下是他在健一会第55期闭门沙龙上的发言。


根据嘉宾意见,分享内容已删去大量敏感观点及内部信息。



数库是做什么的呢?从字面上可以看到,是数据和库的意思,我们是一家以数据来发展做知识业的一个公司。


什么叫知识业?我们推动数据走向智能化,然后从数据里面提炼出知识和智慧。


用在什么地方呢?用于金融领域,确切说的,是二级市场投资金融领域。


数库有六、七年历史,一开始搭建非常结构化的金融数据库——比如说财务报表的搭建——逐步走向不是那么结构化的数据,比如说股东信息,和财务报表相比,相对来讲结构化会更弱一些。这里面我们就开始引用人工结构化的方法加上机器学习的模式。机器学习做的是什么呢?就是根据你的人工做法的容错方法,机器在那边学习,然后时间长了之后呢,人参与的度数就少了,机器就可以做得越多。


再有一块内容,是把所有上市公司业务线全部结构化,搭成产业链,通过产业链将不同信息结合起来,里面包括宏观行业数据和通过产业链搭建的指数数据。


在做这件事情的过程中,数库积累了大量容错表,这个容错带来的是什么?是词库,针对财经领域的词库。词库让我们可以分析非常非结构化的数据,比如说新闻、公告内容的提取。


为什么我们开始会做这个东西呢?其实是源于一个很简单的想法。


我们当时做财经资讯的时候,有一块是新闻板块。新闻板块有个问题:如果我把新闻全文提供给用户的话,需要购买新闻版权。新闻版权非常非常的贵,一家报刊大概是20万到50万。


怎么办呢?我们不能像百度,给你两行字,然后后面是省略号,点进去之后带你到原来的新闻页面,这个用户体验太差了。


我们就开始安排人工写摘要。人工写摘要过程中发现,一个人一天只能写大概20到30篇摘要,而中国一天生产的所有财经新闻大概在9000篇到10000篇,去重后大概是3000篇到4000篇新闻,不太可能通过人工写摘要来实现。


我们说OK,试试能不能用机器来写摘要。以前用机器摘要,要引用自然语言处理的一系列做法。进行自然语言处理时,你会发现需要训练一个词库,然后才能准确地把这个东西给做出来。如果没有这个词库来训练,自然语言处理会做出来一个乱七八糟的东西。


这样我们在过去这么多年积累下来的词库一下子就被运用起来了,通过这个,我们就开始分析分词、分组、分句,包括句子结构组合、语义事件的提取、事件之间的关联及事件情感的算法分析。通过统计手段,再接触深度学习的手段,也就是复杂神经网络的方法。


后来谷歌、facebook、twitter放出来一系列开源性算法,这些算法拿到中国这样一个以中文主导的领域里面时,需要做修改,修改之后还要继续再去训练再去跑。


通过这种方法,我们做了大概两年非常非结构化的信息处理,最终把这块东西跟半结构化以及结构化处理结合起来之后,我们发觉,这块东西的效果可以放在二级市场里面,对量化投资有个非常有意义的飞跃性推进。


以前的量化投资,只是一小撮人在那边玩的一个游戏,并且量化投资所能选择的因子范围非常有限,就是财务和行情,或者就是技术层面和基本面的交叉。但是我们发现,通过技术手段的挖掘,在原来量化投资没办法接触的因子组合里面,可以打造出新的因子出来,而这个因子可以推动二级市场投资产生非常有意思的策略。


这样,我们就不是简单给用户提供数据,而是要告诉客户这个数据怎么样,最后你应该干什么,它是跟投资策略结合起来的,我把那个结果性的东西再把它变成数据化。


我们有两种主要产品形态,一种叫开发者中心。


任何人可以从我这上面获取结果性的算法、数据、因子,可以调用我的接口,通过利用我们已经开发的成果,打造自己的量化策略、跟金融有关系的技术平台或是技术产品。


另一种是一个不需要写代码的可视化操作量化平台。


量化的门槛在哪里?是在于绝大多数做量化的人需要写代码,那么我们把这一套东西放到一个不需要写代码的一个环境里面去,通过界面操作,让一个普通人就可以搭建自己的量化策略。


我们的所有数据都服务于二级市场,我们的词库也是财经类词库,所以我不是谷歌,不是百度,没办法做全方位的结合,但是我在金融领域做的是非常精确的,我的数据质量和它所衍生出来的智慧型因子是非常高质量的,客户可以在开发者中心里做API对接,你可以下载你自己的SDK包,可以到我的数据商城里面去购买相对应数据,搭建各式各样你想做的东西。比如说你要自己开发一个APP的话,你在APP财经类的软件,你要需要从零开始,我现在可以给你非常带有结果性的信息,而且后面是有非常严密的量化逻辑的接口,告诉你怎么去做这块东西的。如果你想自己搭建你自己的量化平台的话,比如说像京东金融的量化平台,你可以直接调用我的这个数据,去做他们的东西。


通过量化平台,你可以选择多因子选股,投资策略会在每月或每周或每季告诉你应该买什么样的投资股票组合。通过数据分析,你可以看到我们这里面各式各样的因子,可以对单个因子做分析,分析这里面不同的纬度,对你预测性的强弱它会做个分析,包括收益率、单因子收益率都会做相对性分析。做了这个东西之后,你就可以搭建自己策略。


这个东西给谁用呢?我们在做大数据分析时,第一个是要把现在机构本身效率提高。原来很多事情是人在做,现在全都是机器就完成了。第二个是什么?这个市场不是说除了机构就是小白,还有当中一层人,这些人有能力、有智慧、有想法,可以去打造自己的策略,但是他没有资源。我们用这种方法把量化和大数据能够做的事情普及给这些人去运用,他们可以在这里搭建投资策略,也可以把策略分享出去。这一套做法其实就是华尔街、陆家嘴最高端那撮金融人士在做的事情,但是现在基本上只要是你有大学水平的话,你就可以做这种东西。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:中国股市 量化投资 国股市 FACEBOOK twitter 中国股市

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-15 03:38