|
首先,我们给每个代理机器学习以初始价格P=100和N(10,10)单位现金对模拟股票市场81000股股票进行情绪重建。控制代理人买卖决策的情绪过程ψ(t)是一个马尔可夫链,具有三种可能的状态,相应的均衡价格(4)为o情绪购买ψb=1,均衡价格P(b)e=271中性,情绪ψn=0,均衡价格P(n)e=100。o带情绪卖出ψs=-平衡价格P(s)e=36。马尔可夫链ψ(t)将在t=1时随机初始化,不同情绪状态之间的切换将根据转移概率矩阵| | aij | |发生=Pb、bPb、nPb、sPn、bPn、nPn、sPs、bPs、nPs、s, (8) 式中,Pi,jis是在一个时间步内从i移动到j的概率。为了实现长期隐藏状态,我们将考虑从间隔AII统一绘制的AIJD值∈ [0.95, 0.98] . (9) 然后,由于(9),系统将在每个情感状态中平均花费20-50个时间步。以这种方式,我们将运行多个交易模拟,随机绘制概率矩阵,考虑约束条件(9),并生成相应的股价时间序列。3.2. 单一HMM重构在上一小节中,我们讨论了一般市场环境,本节将使用该环境生成由马尔可夫链类型的买卖情绪过程控制的股票价格时间序列。在本节中,我们将使用HMM的theBaum-Welch算法从观察到的股票价格行为重建隐藏转移矩阵a fitij。
|