楼主: uiluii.wu@iclou
118 0

[其他] 用jieba库和wordcloud库生成2024年政府工作报告词云 [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

学前班

80%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
30 点
帖子
2
精华
0
在线时间
0 小时
注册时间
2018-8-21
最后登录
2018-8-21

楼主
uiluii.wu@iclou 发表于 2025-11-17 14:10:34 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

一. 准备工作(安装jieba库和wordcloud库)

我是通过pip进行的安装。

1.1 jieba库

首先是jieba库,打开命令行(Win+r,输入cmd),输入以下指令:

pip install jieba

安装完成后,验证是否成功,输入以下命令:

python3//这个是你的python的版本号,所以我们得先安装好python
import jieba
print(jieba.lcut("我爱听音乐"))

如果看到类似['我',‘爱’,‘听’,‘音乐’]的输出结果,说明你已成功安装。

1.2 wordcloud库

在命令行中输入以下指令:

pip install wordcloud

安装完成后,验证是否成功,输入以下命令:

from wordcloud import WordCloud
print("WordCloud库安装成功")

二. 获取2024年政府工作报告文本和遮罩图片

可以从官网上复制2024年政府工作报告的内容,并保存到桌面。创建一个txt文件,将内容粘贴进去。

再找一个遮罩图片,我使用的是中国地图的遮罩图,选择你想要的遮罩图片并保存到桌面:

文本我命名为government_report_2024.txt,图片文件名为chinamap.jpeg:

三. 开始写代码(Python)

1. 这是准备工作:

import jieba
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
import matplotlib.pyplot as plt
from PIL import Image  # 用于打开图片
import numpy as np  # 用于将图片转换为数组

2. 然后读取政府工作报告的文本,根据你文件的路径来读取:

with open(r'D:\txt\government_report_2024.txt', 'r', encoding='utf-8') as f:
    text = f.read()

3. 创建遮罩,指定桌面上的图片(YourUsername位置是你的用户名):

mask_path = "C:/Users/YourUsername/Desktop/china_map.png"

4. 打开图片并转换为数组:

try:
    china_mask = np.array(Image.open(mask_path).convert('L'))
    print("遮罩图片加载成功!")
except Exception as e:
    print(f"加载遮罩图片时出错: {e}")

    # 如果加载失败,可以回退到不使用遮罩
    china_mask = None

5. 生成词云:

wc = WordCloud(
    font_path="simhei.ttf", 
    width=1000,
    height=700,
    background_color="white",
    max_words=200,
    mask=china_mask,  # 应用遮罩
    contour_width=2,  # 可以自己设置为词云轮廓添加宽度
    contour_color='red'  # 也可以自己选择颜色设置轮廓颜色
)

wc.generate(seg_text)

6. 显示和保存图片:

plt.figure(figsize=(12, 8))
plt.imshow(wc, interpolation='bilinear')
plt.axis('off')
plt.title('2024年政府工作报告词云图(中国地图轮廓)')
plt.show()

7. 将图片保存到文件中:

wc.to_file('2024_gov_report_china_shape.png')
print("词云图已保存为 '2024_gov_report_china_shape.png'")

然后生成的图片就会显示出来:

你也可以按照上述步骤生成其他词云。

以上是我的学习笔记,如有错误,希望指出,谢谢。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:政府工作报告 cloud 工作报告 word Clou

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2025-12-5 13:19