经济政策的沟通如何影响经济成果?中央银行对小型企业、住房市场或政府财政的看法如何?本文将深入探讨 CentralBankRoBERTa,这是一款尖端的经济实体分类工具,不仅能够区分五类基础的宏观经济实体,还能作为二元情绪分类器,识别宏观经济交流中句子的情感内容。该模型经过了超过12,000条来自美国联邦储备系统、欧洲中央银行及国际清算银行成员的手动标注句子训练。
towardsdatascience.com/centralbankroberta-an-llm-for-macroeconomics-deccd9570212?source=collection_archive---------11-----------------------#2024-02-28
本文由 Vincent P. Marohl 共同撰写,基于 Pfeifer, M. 和 Marohl, V.P.(2023)“CentralBankRoBERTa: A Fine-Tuned Large Language Model for Central Bank Communications”,发表在《金融与数据科学杂志》上。
随着大型语言模型(LLM)的进步,针对特定应用的微调变得越来越便捷。实现顶尖的分类效果,只需大量特定领域的训练数据。尽管如此,目前尚无 LLM 能够为宏观经济议题生成情绪标签。毕竟,“积极”的宏观经济句子究竟意味着什么呢?
我们研发了 CentralBankRoBERTa。这一基于 RoBERTa 架构的模型专为分类经济情感句子设计,同时也能识别出“谁”最在意。该模型最初是为了中央银行的沟通而设计,旨在衡量语言对经济的具体影响。
中央银行沟通的独特之处在于,必须明确哪些构成对“谁”的正面经济信号。例如,“工资超出预期增长”这句话对家庭(工资的受益者)来说是正面的,但对雇主(支付工资的一方)而言则是负面的。CentralBankRoBERTa 根据“对谁有利”来分类句子,即使缺乏进一步的数字背景信息,也能判断句子传达的是正面还是负面信号。
doi.org/10.1016/j.jfds.2023.100114
在文本分析中,理解上下文和受众至关重要,尤其是对于经济政策这样复杂的主题。因为信息的接受方式会根据受众和环境产生显著变化。CentralBankRoBERTa 通过精准识别特定受众和上下文下的经济情感,体现了这一点的重要性。
中央银行广泛的职责范围使该模型具有广泛的应用价值。无论是中央银行行长、CEO,还是财政部长、对冲基金经理、记者等经济参与者,表达关于公司或其他经济实体的好消息或坏消息都同样重要,他们的观点有助于塑造经济。
接下来,我们将展示如何运用 CentralBankRoBERTa 来分析叙述对经济的影响,通过研究商业和货币政策信息。任何相关的文本资料均可用于此目的。本案例中,我们使用了美国上市公司的财报电话会议记录和美国证券交易委员会(SEC)文件的数据集。通过正则表达式清洗这些数据后,利用 CentralBankRoBERTa 对每个句子进行标注,以获取情感评分,具体方法将在下一部分详细介绍。
最终的数据集涵盖了大约2000家美国上市公司,每家公司大约有20年的季度文本数据。为了观察它们之间的联系,我们还标注了美联储讲话的文本数据集,仅选择提及特定公司的句子,以排除不相关的信息。
研究表明,州级公司的平均情感评分与商业周期紧密相连。例如,德克萨斯州的地区联储沟通,如下图所示,也显示出与商业周期的高度相关性。

图 1:德州公共公司的感情变化(深蓝色虚线)与商业周期(红线)紧密相连。达拉斯联储针对公司的特定沟通(青绿色虚线)同样表现出高度的一致性。
图 2:全国范围内,企业的情绪(深蓝色虚线)与商业周期(红线)有显著的同步性。专门讨论企业的 FOMC 沟通(绿松石色虚线)也紧随其后。
通过 CentralBankRoBERTa 对企业情绪的描述性分析,揭示了经济叙述与企业市场动态之间的联系。尤其是在2008年的大衰退和2020年的COVID-19疫情期间,这些经济低谷被企业和FOMC的情绪准确地反映出来。
这个简单的例子展示了文本数据在丰富经济模型方面的潜力。虽然文本中表达的情感趋势能够影响经济动态,但这些趋势却难以捕捉。诸如 CentralBankRoBERTa 这类工具可以帮助研究者和政策制定者填补这一空白。
叙事研究与经济事件影响之间的差距
2013年诺贝尔经济学奖得主罗伯特·席勒在其著作《叙事经济学》(2019年)中指出,故事或叙事如同病毒般在社会上传播,直接作用于消费、储蓄和投资决策。认识到叙事的力量为经济分析开辟了新的视角,意味着除了传统的经济指标之外,关注流行故事及其情感共鸣可以为市场波动和经济变化提供预见性的洞察。因此,将叙事分析整合进经济模型,能够提升我们预测和应对未来经济挑战的能力,成为经济学家、政策制定者和投资者的重要工具。
如何使用 CentralBankRoBERTa
使用 CentralBankRoBERTa 相当简便。首先,从 transformers 库中导入管道。接着,利用 Hugging Face 上提供的模型名称加载模型。创建输入句子并将其传递给分类器。若需对整个数据集进行分类,我们提供了一份包含额外代码的示例脚本,可在 GitHub 上找到。CentralBankRoBERTa 特别适用于句子级别的分析,因此建议用户将长篇文本分解成单个句子。例如,在美联储最近一次 FOMC 会议纪要中提到,“员工提供了关于美国金融体系稳定性的评估更新,并整体上认为该体系的金融脆弱性显著。” 当我们将这句话输入代理分类器时,模型以96.6%的置信度判断该句与“金融部门”有关。同时,情感分类器的结果显示,该句子为“负面”的概率为80.9%。
# 使用情感分类器
from transformers import pipeline
# 加载情感分类器模型
agent_classifier = pipeline("text-classification", model="Moritz-Pfeifer/CentralBankRoBERTa-sentiment-classifier")
# 选择你的输入
input_sentence = "我们的政策紧缩早期效果也开始显现,特别是在对利率变化敏感的制造业和建筑业等领域。"
# 执行情感分析
sentiment_result = agent_classifier(input_sentence)
print("情感:", sentiment_result[0]['label'])
# 使用代理分类器
from transformers import pipeline
# 加载代理分类器模型
agent_classifier = pipeline("text-classification", model="Moritz-Pfeifer/CentralBankRoBERTa-agent-classifier")
# 选择你的输入
input_sentence = "我们利用流动性工具向可能需要资金的银行提供资金支持。"
# 执行代理分类
agent_classification_result = agent_classifier(input_sentence)
print("代理分类:", agent_classification_result[0]['label'])
agent_result = agent_classifier(input_sentence)
print("Agent Classification:", agent_result[0]['label'])
未来方向
CentralBankRoBERTa 是一款先进的大型语言模型,能够以高度精确的方式分析宏观经济情绪。作为首个专门针对经济代理的分类器,该模型凭借其广泛的训练数据,适用于各种宏观经济应用场景,包括经济、金融及政策研究领域。我们期待你能够从中发现新的灵感,并分享几个由这一大型语言模型激发的未来研究方向:
- FOMC 新闻发布会: 是否可以运用 CentralBankRoBERTa 来预测美联储公告对金融市场的影响?同样的方法是否适用于企业财报电话会议的分析?
- 新闻报道分析: 媒体是如何看待经济状况的?是否存在对特定经济群体的倾向性报道?
- 在线论坛监测: 利用 CentralBankRoBERTa,我们能否从网络论坛的讨论中预测未来的经济趋势?
- 受众偏好分析: 哪些政客更倾向于支持哪些经济群体?
进一步资源
关于我们的模型在《金融与数据科学期刊》上的发表详情,请参阅:
Pfeifer, M. 和 Marohl, V.P. (2023) “CentralBankRoBERTa:专为中央银行沟通而优化的大型语言模型”,金融与数据科学期刊
doi.org/10.1016/j.jfds.2023.100114
了解更多关于模型的详细研讨会信息,请访问:
模型在 Hugging Face 上的管道:
[## Moritz-Pfeifer/CentralBankRoBERTa-agent-classifier · Hugging Face
我们正致力于通过开源和开放科学促进人工智能技术的推广和发展。
huggingface.co](https://huggingface.co/Moritz-Pfeifer/CentralBankRoBERTa-agent-classifier?source=post_page-----deccd9570212--------------------------------)
[## Moritz-Pfeifer/CentralBankRoBERTa-sentiment-classifier · Hugging Face
我们正致力于通过开源和开放科学促进人工智能技术的推广和发展。
huggingface.co](https://huggingface.co/Moritz-Pfeifer/CentralBankRoBERTa-sentiment-classifier?source=post_page-----deccd9570212--------------------------------)


雷达卡


京公网安备 11010802022788号







