楼主: shadowaver
1467 2

[原创博文] 三国演义词频统计 [推广有奖]

随心所欲不逾矩

已卖:1243份资源

教授

56%

还不是VIP/贵宾

-

威望
0
论坛币
8309 个
通用积分
689.8825
学术水平
18 点
热心指数
22 点
信用等级
13 点
经验
29709 点
帖子
890
精华
0
在线时间
1375 小时
注册时间
2007-9-27
最后登录
2026-1-22

楼主
shadowaver 在职认证  发表于 2024-7-30 15:54:43 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
三国演义词频统计
总字数602414

总词数399542

top 10:



wordscountsize

0

曹操

953

0.55%

1

孔明

836

0.48%

2

将军

772

0.44%

3

却说

656

0.38%

4

玄德

585

0.34%

5

关公

510

0.29%

6

丞相

491

0.28%

7

二人

469

0.27%

8

不可

440

0.25%

9

荆州

425

0.24%

10

孔明曰

390

0.22%

11

玄德曰

390

0.22%

12

不能

384

0.22%

13

如此

378

0.22%

14

张飞

358

0.21%

15

商议

344

0.20%

16

如何

338

0.19%

17

主公

331

0.19%

18

军士

317

0.18%

19

吕布

300

0.17%

20

左右

294

0.17%

21

军马

293

0.17%

22

赵云

278

0.16%

23

刘备

277

0.16%

24

引兵

276

0.16%

25

次日

271

0.16%

26

大喜

268

0.15%

27

云长

265

0.15%

28

孙权

264

0.15%

29

天下

255

0.15%

30

东吴

251

0.14%

31

于是

250

0.14%

32

今日

243

0.14%

33

不敢

239

0.14%

34

魏兵

233

0.13%

35

陛下

223

0.13%

36

一人

221

0.13%

37

都督

221

0.13%

38

司马懿

221

0.13%

39

人马

220

0.13%

40

不知

219

0.13%

41

周瑜

217

0.12%

42

汉中

211

0.12%

43

只见

207

0.12%





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:三国演义 counts words Count size 三国演义 词频 统计

shadowaver@163.com
QQ 540722048

沙发
shadowaver 在职认证  发表于 2024-7-30 15:55:54
top 10 ranking

捕获.PNG (65.87 KB)

top 10 rank

top 10 rank

藤椅
shadowaver 在职认证  发表于 2024-7-30 15:56:38

# 打印文件名称
for filename in filenames:
    print(filename)

import jieba
   
file_path= r'C:\Users\apache\Desktop\上卷.txt'
file=open(file_path,'r',encoding='utf-8')
counts=file.read()
# file.readlines()[10]
words=jieba.lcut(counts)
file.close()

count_words={}
for item in words:
    if len(item)==1:
        continue
    if item not in count_words:
        count_words[item]=1
    else:
        count_words[item]+=1

list_count=list(count_words.items())

list_count.sort(key=lambda x:x[1],reverse=True)

import pandas as pd

df=pd.DataFrame(data=count_words.items(),columns=['words','count'])
df.sort_values(by='count',ascending=False,inplace=True)

df.reset_index(inplace=True)
df.rename(columns={'index':'new'},inplace=True)
df.reset_index(inplace=True)

import matplotlib.pyplot as plt

df.plot()
df['count'].plot()

plt.rcParams['font.sans-serif'] = ['SimHei']
df['size']=df['count']/df['count'].sum()
df['count'].sum()

plt.pie(df['size'],labels=df.words)

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-27 10:33