楼主: _wallstreetcat_
13023 8

[统计套利] 协整套利的实现 [推广有奖]

  • 0关注
  • 36粉丝

已卖:114份资源

讲师

9%

还不是VIP/贵宾

-

威望
0
论坛币
88 个
通用积分
41.5574
学术水平
14 点
热心指数
13 点
信用等级
13 点
经验
6402 点
帖子
257
精华
0
在线时间
235 小时
注册时间
2017-3-16
最后登录
2024-10-20

楼主
_wallstreetcat_ 企业认证  发表于 2017-3-28 11:42:57 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Pairs Trading,即配对交易策略。其基本原理就是找出两只走势相关的股票。这两只股票的价格差距从长期来看在一个固定的水平内波动,如果价差暂时性的超过或低于这个水平,就买多价格偏低的股票,卖空价格偏高的股票。等到价差恢复正常水平时,进行平仓操作,赚取这一过程中价差变化所产生的利润。为了实现协整套利,首先要针对不同的股票时间序列进行协整分析,找到价格走势高度相关的股票对。(原文链接在此,不想复制代码的小伙伴可以到这里直接克隆运行)
在 Python 的 Statsmodels 包中,有直接用于协整关系检验的函数 coint,该函数包含于 statsmodels.tsa.stattools 中。


  1. import numpy as np
  2. import pandas as pd
  3. import statsmodels.api as sm
  4. import seaborn as sns
复制代码
首先,我们构造一个读取股票价格,判断协整关系的函数。该函数返回的两个值分别为协整性检验的 p 值矩阵以及所有传入的参数中协整性较强的股票对。我们不需要在意 p 值具体是什么,可以这么理解它: p 值越低,协整关系就越强;p 值低于 0.05 时,协整关系便非常强。


  1. def find_cointegrated_pairs(dataframe):
  2.     # 得到DataFrame长度
  3.     n = dataframe.shape[1]
  4.     # 初始化p值矩阵
  5.     pvalue_matrix = np.ones((n, n))
  6.     # 抽取列的名称
  7.     keys = dataframe.keys()
  8.     # 初始化强协整组
  9.     pairs = []
  10.     # 对于每一个i
  11.     for i in range(n):
  12.         # 对于大于i的j
  13.         for j in range(i+1, n):
  14.             # 获取相应的两只股票的价格Series
  15.             stock1 = dataframe[keys[i]]
  16.             stock2 = dataframe[keys[j]]
  17.             # 分析它们的协整关系
  18.             result = sm.tsa.stattools.coint(stock1, stock2)
  19.             # 取出并记录p值
  20.             pvalue = result[1]
  21.             pvalue_matrix[i, j] = pvalue
  22.             # 如果p值小于0.05
  23.             if pvalue < 0.05:
  24.                 # 记录股票对和相应的p值
  25.                 pairs.append((keys[i], keys[j], pvalue))
  26.     # 返回结果
  27.     return pvalue_matrix, pairs
复制代码
然后我们设置要协整分析的股票范围和分析的起止时间范围,我们可以选择画出协整检验热度图,这里画的是1-pvalues,颜色越红表示对应的股票对协整关系越稳定。
  1. instruments =D.instruments()[0:20]
  2. # 确定起始时间
  3. start_date = '2015-01-01'
  4. # 确定结束时间
  5. end_date = '2017-02-18'
  6. # 获取股票总市值数据,返回DataFrame数据格式
  7. prices_temp = D.history_data(instruments,start_date,end_date,
  8.               fields=['close'] )
  9. prices_df=pd.pivot_table(prices_temp, values='close', index=['date'], columns=['instrument'])
  10. pvalues, pairs = find_cointegrated_pairs(prices_df)
  11. #画协整检验热度图,输出pvalue < 0.05的股票对
  12. #sns.heatmap(1-pvalues, xticklabels=instruments, yticklabels=instruments, cmap='RdYlGn_r', mask = (pvalues == 1))
  13. #print(pairs)
复制代码
我们对pvalue排序,较小的pvalue表示对应的股票对的协整关系越稳定。
  1. df = pd.DataFrame(pairs, index=range(0,len(pairs)), columns=list(['Name1','Name2','pvalue']))
  2. #pvalue越小表示相关性越大,按pvalue升序排名就是获取相关性从大到小的股票对
  3. df.sort_values(by='pvalue')
复制代码
1.png
我们选择协整关系最强的一组股票对,绘制走势图并进行最小二乘回归,获取回归系数。


  1. x = prices_df["000012.SZA"]
  2. y = prices_df["000017.SZA"]
  3. plt=x.plot();
  4. plt.plot(y);
  5. X = sm.add_constant(x)
  6. result = (sm.OLS(y,X)).fit()
  7. print(result.summary())
  8. plt.legend(["000012.SZA", "000017.SZA"],loc='best')
复制代码
2.png

根据获得的回归系数,构造回归方程 y=const+coef*x 也就得到y-coef*x这个价差平稳序列,画出这个平稳序列可以看出,虽然价差上下波动,但都会回归中间的均值。
接着我们构造z-score函数,计算时间序列偏离了其均值多少倍的标准差
  1. def zscore(series):
  2.     return (series - series.mean()) / np.std(series)
复制代码
计算价差的zscore函数序列并绘图
  1. XZ=zscore(0.2048*x-y)
  2. plt=XZ.plot()
  3. plt.axhline(1.0, color="red", linestyle="--")
  4. plt.axhline(-1.0, color="green", linestyle="--")
  5. plt.legend(["z-score", "mean", "+1", "-1"])
复制代码
3.png
可以看出此序列基本在-1到1之间波动,当两这个序列的 z-score序列 突破 1 或者 −1 时,说明两支股票的价差脱离了统计概念中的合理区间,如果它们的协整关系能够保持,那么它们的价差应该收敛
结合上图,当 z-score 突破上方红线时,说明y-coef*x高估,推测此差值应在未来降低到合理的波动区间,因此可以卖空1份的y标的,买入coef份的x标的,等待y-coef*x回归到0附近时平仓获利;反之,当 z-score 突破下方绿线时,说明y-coef*x低估,推测此差值应在未来上升加到合理的波动区间,因此可以买入1份的y标的,卖空coef份的x标的,等待y-coef*x回归到0附近时平仓获利。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
fantuanxiaot + 33 + 33 精彩帖子
accumulation + 100 + 1 + 1 + 1 精彩帖子

总评分: 经验 + 133  论坛币 + 33  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

本帖被以下文库推荐

沙发
ydc129 发表于 2017-3-29 19:27:58
谢谢分享

藤椅
hw4m14 发表于 2017-5-17 15:43:40
这个是量化论坛里面的帖子吧,里面有一些问题:
1,只有当单个股票价格非平稳,两只股票存在同阶协整的时候才能做协整关系检验;
2,p值越小协整关系越强这个说法有问题,只能说在p<0.05的时候否定原假设,认为股票对有协整关系。

板凳
hw4m14 发表于 2017-5-17 15:43:57
这个是量化论坛里面的帖子吧,里面有一些问题:
1,只有当单个股票价格非平稳,两只股票存在同阶协整的时候才能做协整关系检验;
2,p值越小协整关系越强这个说法有问题,只能说在p<0.05的时候否定原假设,认为股票对有协整关系。

报纸
_wallstreetcat_ 企业认证  发表于 2017-5-17 15:52:23
hw4m14 发表于 2017-5-17 15:43
这个是量化论坛里面的帖子吧,里面有一些问题:
1,只有当单个股票价格非平稳,两只股票存在同阶协整的时候 ...
多谢。其实这只是回测,真正实盘没有这么简单。而且中国还不允许做空

地板
hw4m14 发表于 2017-5-17 16:27:23
嗯 期货市场高频交易可能可以,要考虑交易成本。a股股票市场不能做空,t+1 ,我试着去做了回测 结果很不好,也可能方法不对

7
lwell20 发表于 2017-5-17 17:33:24

8
被被 发表于 2017-5-19 15:41:51
谢谢楼主分享

9
雨萧扬 在职认证  发表于 2017-7-28 11:54:45
弱弱问一句
D是什么啊~~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jr
拉您进交流群
GMT+8, 2025-12-30 10:24