|
从基于规则的方法到统计方法,再到深度学习等最新发展,在商业激励和其可应用的深远领域的推动下,该领域的研究正在蓬勃发展。由于各个领域之间的情绪分析方法各不相同,因此不存在一个可供追求的跨领域最先进的准确度。此外,应考虑注释者之间协议中出现的意见的主观性。例如,如果我们考虑一个80%的注释者协议,它意味着人类大约有20%的时间会不同意任何指定的标签。最后,应该注意的是,本研究的目标不是为比特币域建立完美的情绪分类,而是选择准确度令人满意的分类(最好在基准的10%范围内),以便进一步分析与市场波动相关的情绪。Pang和Lee在[33]中对基于机器学习的情感分析方法进行了早期研究,结果表明,机器学习技术,如朴素贝叶斯、逻辑回归和支持向量机,在单图和双图特征上,可以与电影评论的人类生成基线相媲美(准确率为82%)。通过首先使用这些算法分析数据,我们可以发现是否存在相关性和因果关系。如果有,未来的研究可以调查改善情绪分类是否可以加强这种相关性,从而使错误分类不会传播到交易模型中。2.4数据标签标记代表性数据是自然语言处理和机器学习过程的组成部分,这些过程试图从正确标记的数据集中学习。在有监督机器学习中,模型首先根据包含正确标签的数据进行训练,以便模型可以从特征中学习分类功能。
|