一. 准备工作(安装jieba库和wordcloud库)
我是通过pip进行的安装。
1.1 jieba库
首先是jieba库,打开命令行(Win+r,输入cmd),输入以下指令:
pip install jieba
安装完成后,验证是否成功,输入以下命令:
python3//这个是你的python的版本号,所以我们得先安装好python
import jieba
print(jieba.lcut("我爱听音乐"))
如果看到类似['我',‘爱’,‘听’,‘音乐’]的输出结果,说明你已成功安装。
1.2 wordcloud库
在命令行中输入以下指令:
pip install wordcloud
安装完成后,验证是否成功,输入以下命令:
from wordcloud import WordCloud
print("WordCloud库安装成功")
二. 获取2024年政府工作报告文本和遮罩图片
可以从官网上复制2024年政府工作报告的内容,并保存到桌面。创建一个txt文件,将内容粘贴进去。
再找一个遮罩图片,我使用的是中国地图的遮罩图,选择你想要的遮罩图片并保存到桌面:
文本我命名为government_report_2024.txt,图片文件名为chinamap.jpeg:
三. 开始写代码(Python)
1. 这是准备工作:
import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import matplotlib.pyplot as plt
from PIL import Image # 用于打开图片
import numpy as np # 用于将图片转换为数组
2. 然后读取政府工作报告的文本,根据你文件的路径来读取:
with open(r'D:\txt\government_report_2024.txt', 'r', encoding='utf-8') as f:
text = f.read()
3. 创建遮罩,指定桌面上的图片(YourUsername位置是你的用户名):
mask_path = "C:/Users/YourUsername/Desktop/china_map.png"
4. 打开图片并转换为数组:
try:
china_mask = np.array(Image.open(mask_path).convert('L'))
print("遮罩图片加载成功!")
except Exception as e:
print(f"加载遮罩图片时出错: {e}")
# 如果加载失败,可以回退到不使用遮罩
china_mask = None
5. 生成词云:
wc = WordCloud(
font_path="simhei.ttf",
width=1000,
height=700,
background_color="white",
max_words=200,
mask=china_mask, # 应用遮罩
contour_width=2, # 可以自己设置为词云轮廓添加宽度
contour_color='red' # 也可以自己选择颜色设置轮廓颜色
)
wc.generate(seg_text)
6. 显示和保存图片:
plt.figure(figsize=(12, 8))
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.title('2024年政府工作报告词云图(中国地图轮廓)')
plt.show()
7. 将图片保存到文件中:
wc.to_file('2024_gov_report_china_shape.png')
print("词云图已保存为 '2024_gov_report_china_shape.png'")
然后生成的图片就会显示出来:
你也可以按照上述步骤生成其他词云。
以上是我的学习笔记,如有错误,希望指出,谢谢。


雷达卡


京公网安备 11010802022788号







