|
下面描述了所测试的三个模型的体系结构。提出的CNN模型由以下连续层组成:1。使用大小为(10,42)的16个滤波器进行1D卷积2。使用大小为(10,)3的16个滤波器进行1D卷积。使用大小为(8,)4的3个滤波器进行1D卷积。使用大小为(6,)5的3个2滤波器进行1D卷积。使用大小为(4,)6的3个2滤波器进行1D卷积。与3个神经元7完全连接的层。具有3个神经元的完全连接层用于CNN所有共有和完全连接层的激活函数是参数整流线性单元(PRELU)[40]。最后一层对0 50 100 150 200 250 300LSTM步骤0.300.320.34CostTrainTest使用s oftmax函数。图3:LSTM网络每重复步骤的平均成本预测不同类别之间的概率分布。所有卷积层后面都是批量标准化(BN)层。L STM网络使用32个隐藏神经元,然后是一个前馈层,其中64个神经元使用Dropout和PREL U作为激活函数。通过实验我们发现,LSTM的隐藏层应该包含64个或更少的隐藏神经元,以避免模型过拟合。如果数据集更大,那么用更多的隐藏神经元进行实验是可行的。最后,CNN-LSTM模型将卷积特征提取层应用于输入,然后按正确的时间顺序将其输入LSTM模型。CNN组件由以下层组成:1。使用大小为(5,42)2的16个滤波器进行1D卷积。使用大小为(5,)3的16个滤波器进行1D卷积。使用大小为(5,)4的3个滤波器进行1D卷积。1维卷积,3个2个大小的滤波器(5),请注意,CNN模块中每个卷积滤波器的接收域小于独立的CNN,因为LSTM可以捕获过去时间步中的大部分信息。
|