【数据名称】美国白宫赢学指数(Winning Index of White House Communications)
【数据来源】美国白宫官网(WhiteHouse.gov)发布的官方文章
【时间跨度】2025年1月20日 - 2026年1月7日
【区域范围】美国
【数据格式】Excel (.xlsx)、CSV (.csv)
数据简介
自2025年1月20日特朗普再次就任美国总统以来,白宫官网发布的官方文章在叙事风格上呈现出显著变化。大量文本反复使用"胜利""成功""伟大""历史性成就""前所未有"等表述,对在其领导下的美国政府行为进行高度正向、自我肯定式的描述。
为了系统刻画这种政治修辞特征,并将其从直观感受转化为可量化、可比较的指标,构建了《美国白宫赢学指数》。
"赢学指数"并非简单的情绪分值,而是一个多维度政治修辞指数,重点刻画白宫官方文本中"胜利—成就—伟大"叙事的密度、结构与情绪强度。
指标构成
指标主要由以下三部分构成:
一、赢学关键词强度(Lexical Component)
构建了一套定制化的"赢学词库",涵盖三类核心语义:
1. 胜利/成就结果词:win, victory, triumph, success, achievement, justice 等
2. 伟大/强度修饰词:great, historic, unprecedented, remarkable, tremendous 等
3. 主体与自我指涉词:President, Trump, administration, we, America 等
通过统计这些关键词在文本中的出现频率(并对文章长度进行标准化),衡量单篇文章的"赢学语言密度"。
二、句子层面的"协同赢学"结构(Sentence-level Component)
考虑到"赢"往往不是由单个词触发,而是通过多个语义要素在同一句中共同出现来建构叙事,进一步引入句子层面的分析:
- 当一个句子中同时出现至少两类语义时,该句被识别为"赢学句"
- 计算每篇文章中"赢学句"在全部句子中的占比
三、赢学语境下的情绪强度(Sentiment Component)
情绪分析仅在"赢学语境句"中计算:
- 使用VADER情绪分析工具
- 仅对包含"胜利/伟大"等关键词的句子计算情绪分值
- 得到"赢学语境下的平均正向情绪强度"
数据指标
日度数据 daily_winning_index.csv:
date - 日期
n_articles - 当日文章数量
avg_lex_per1000 - 平均赢学关键词密度(每千词)
avg_tfidf - 平均TF-IDF值
avg_win_sentence_ratio - 平均赢学句占比
avg_win_sentiment - 平均赢学语境情绪强度
avg_winning_index - 日度赢学指数(标准化值)
total_words - 当日总词数
文章级数据 article_level_winning_index.csv:
包含每篇文章的详细赢学指标数据。
指数解读
综合指数与标准化处理:
上述三类指标在文章层面计算后,进行标准化(z-score),并按权重加总,形成单篇文章的赢学指数。随后,将文章级指数按日期汇总,得到每日美国白宫赢学指数。
指数为标准化值:
- 数值高于0:表示当日"赢学叙事"强于样本期平均水平
- 数值低于0:表示弱于样本期平均水平
文件列表
1. daily_winning_index.csv - 日度赢学指数数据
2. article_level_winning_index.csv - 文章级赢学指数数据
3. 美国白宫文本库.xlsx - 原始文本数据
美国白宫赢学指数(2025.1.20-2026.1.07).zip
(266.04 KB, 需要: RMB 19 元)


雷达卡



京公网安备 11010802022788号







