楼主: CDA网校
2954 9

[数据挖掘理论与案例] 数据告诉你,剧版“浪姐”《三十而已》凭什么这么戳中观众的心—CDA人工智能学院 [推广有奖]

管理员

已卖:189份资源

泰斗

3%

还不是VIP/贵宾

-

威望
3
论坛币
118687 个
通用积分
10372.7424
学术水平
278 点
热心指数
286 点
信用等级
253 点
经验
228167 点
帖子
6921
精华
19
在线时间
4377 小时
注册时间
2019-9-13
最后登录
2026-1-6

初级热心勋章

楼主
CDA网校 学生认证  发表于 2020-7-27 14:44:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
CDA人工智能学院致力于以优质的人工智能在线教育资源助力学员的DT职业梦想!课程内容涵盖数据分析、机器学习、深度学习、人工智能、TensorFlow、PyTorch、知识图谱等众多核心技术及行业案例,让每一个学员都可以在线灵活学习,快速掌握AI时代的前沿技术。PS:私信我即可获取《银牌会员》1个月免费试听机会
CDA数据分析师 出品
作者:Mika

数据:真达

后期:泽龙

【导读】

最近《三十而已》这部剧频频霸占微博热搜,今天我们就来聊一聊。

Python技术部分请直接看第四部分。

Show me data,用数据说话

今天我们聊一聊 《三十而已》


《乘风破浪的姐姐》已成为这个夏天最火爆的话题,前有国综"浪姐"高歌猛进,后有这部剧版"浪姐"《三十而已》让人眼前一亮。

最近微博热搜几乎都被这部剧承包了,几乎是每播一集就能上热搜的那种,让追剧都能知道剧情进展到哪儿了。
u=2804253856,2433110377&fm=173&app=25&f=JPEG.jpg

在这部剧中,江疏影、童瑶和毛晓彤三人携手演绎了30岁都市女性的3种人生以及所面对的3种困境。剧中各种名场面也是让这部剧彻底出圈了。

童瑶饰演的全职太太顾佳,江湖人称:许子言妈妈、散打教练、特级甜品师、情商管理专家、育儿专家、儿童心理学者、中国好闺蜜、顶级宫斗高手、幻山烟花公司幕后老。

为了保护儿子,手撕伤害儿子的人

97214070c86a772a743d90f8f1474550.gif
为融入贵妇圈

掏家底也要买爱马仕鸵鸟皮Kelly28

u=2273744410,97245447&fm=173&app=25&f=JPEG.jpg

c4c3b367dd711d9582bea3eabfcc42b5.gif

江疏影饰演的是奢侈品店的销售王漫妮,妥妥的一名沪漂。演绎了目前社会上很多“社畜”的真实生活,生病了身边照顾自己的人都没有,只能一个人住院。

毛晓彤饰演的钟晓是一个普通的上海小囡nan,她的婚姻看似稳定,但与丈夫却貌合神离,一个大大咧咧神经大条,另一个沉默寡言、不愿沟通。

u=4000748153,3355345846&fm=173&app=25&f=JPEG.jpg u=530185744,571259756&fm=173&app=25&f=JPEG.jpg u=176719672,2867064362&fm=173&app=25&f=JPEG.jpg


那么这部《三十而已》是怎么火起来的?

哪些点最戳中观众的心呢?

今天我们就来用数据带你盘一盘。

01女性角色不断霸屏

近几年这类聚焦女性的影视剧层出不穷:

美剧方面

《致命女人》堪称复仇类肥皂剧顶级配置,
《大小谎言》将家庭里的谎言、爱与暴力演绎的淋漓尽致,
《了不起的麦瑟尔夫人》则让我们看到了上个世纪女性的辛酸和成长

u=127923898,2310438940&fm=173&app=25&f=JPEG.jpg u=1342056754,182755111&fm=173&app=25&f=JPEG.jpg u=3096682644,1043916314&fm=173&app=25&f=JPEG.jpg


英剧《杀死伊芙》上演了一场正邪双方的猫鼠游戏
《我的天才女友》讲述了发生在意大利那不勒斯小城一段跨越漫长岁月的友谊
日剧《东京女子图鉴》和韩剧《请输入搜索词:WWW》也都将焦点在都市女性的日常生活和职场中。
u=4148386731,996518879&fm=173&app=25&f=JPEG.jpg u=306629420,31626923&fm=173&app=25&f=JPEG.jpg u=2359073208,4115682469&fm=173&app=25&f=JPEG.jpg



而今年夏天,屏幕上活跃的女性身影更是不少。前有《乘风破浪的姐姐们》引发的全民讨论,之后的国产剧《二十不惑》和《三十而已》不约而同把话题指向女性的年龄问题。


02《三十而已》怎么突然火了

一开始也许没人想到,这样一部聚焦女性角度的国产都市剧能在这个夏天彻底火了。看到百度指数,对比同期播出也是围绕女性话题的《二十不惑》,《三十而已》的热度和搜索度都要高出很多,从7月17日首播起热度就高居不下。
u=3922766712,1298594956&fm=173&app=25&f=JPEG.jpg

目前微博话题《三十而已》阅读量达到42.2亿,讨论达到148.8万。该剧也频频霸占微博热搜,几乎更新一集就会有新的热搜,让你忍不住去追剧。

u=1997525707,662818342&fm=173&app=25&f=JPEG.jpg
看剧中,你会折服于顾佳的强大家庭女性人设;
u=3376891826,1814470265&fm=173&app=25&f=JPEG.jpg

剧中钟晓芹的老公陈屿是非常有争议的角色。他在婚姻中对妻子不关心不沟通的态度让很多人气愤不已,一度微博话题被#陈屿气死#还上了热搜。
u=1504547667,455086773&fm=173&app=25&f=JPEG.jpg

甚至还有像“众盼芹离”这样的词都出来了。
u=3336401734,1009044253&fm=173&app=25&f=JPEG.jpg

03《三十而已》中是什么最戳中观众的心?

1豆瓣数据

接着我们分析了豆瓣的短评数据。目前这部剧豆瓣上共有4万2千余人进行评分,分数为8分。在国产剧中是很不错的成绩了。

u=1874400748,2085741629&fm=173&app=25&f=JPEG.jpg
在评分方面,我们以其中500条数据为代表。

评论中提到最多的主演
u=2010177600,762628337&fm=173&app=25&f=JPEG.jpg

我们进行排序发现位居首位的是王漫妮,然后是顾佳和钟晓芹。

豆瓣小组主演话题热度
u=4053984253,3151446670&fm=173&app=25&f=JPEG.jpg

对比一下在《三十而已》的豆瓣小组里,讨论话题度最高的就属陈屿了。

豆瓣评论词云
u=246490059,1410209391&fm=173&app=25&f=JPEG.jpg

豆瓣评论中主要围绕的关键词有"女性"、"剧情"、"喜欢"等方面。演员中"江疏影"、"童瑶"也被多次提到。

2腾讯视频弹幕

接下来我们还分析整理了腾讯视频弹幕数据,目前共出了 15集,共整理了271049条弹幕。

首先,看到用户在发弹幕时最喜欢选用的角色标签排名:

用户喜欢用的弹幕角色
u=3485351613,1573412079&fm=173&app=25&f=JPEG.jpg

其中王漫妮排名第一,顾佳、钟晓芹分别位居二三。这方面与豆瓣一致。男性角色排名是陈屿以及许幻山。

再看到不同角色的弹幕词云:

王漫妮弹幕词云
u=2912432399,3984465471&fm=173&app=25&f=JPEG.jpg

江疏影饰演的王漫妮讨论度很高,这也与演员的演技和本身的人气是分不开的。气质这块拿捏的死死的,而且作为奢侈品店销售,王漫妮在话术和专业度上也让人感觉很真实。

顾佳弹幕词云
u=950194785,77551656&fm=173&app=25&f=JPEG.jpg

下面是童瑶饰演的全职太太顾佳。顾佳谐音这个名字照顾家庭,不仅要照顾孩子,把家里打理的井井有条,还有扶持老公的烟花公司,这个女人实在是太不一般了。关键词中 "厉害"、"聪明"、"完美"被多次提到。

钟晓芹弹幕词云

u=2972353528,4140798967&fm=173&app=25&f=JPEG.jpg
钟晓芹作为普通的上海本地小姑娘,性格"单纯可爱"。而面对一点也不善解人意的老公,弹幕中感叹"怎么还不离婚"的也特别多。

陈屿弹幕词云

u=638985909,2632912977&fm=173&app=25&f=JPEG.jpg
陈屿和许幻山两个丈夫都有各自的问题。陈屿性格冷漠,关心自己养的鱼胜过老婆。

许幻山弹幕词云
u=3850543093,2881229492&fm=173&app=25&f=JPEG.jpg

许幻山是纯粹的烟花设计艺术家,在公司运营方面显得"幼稚",不懂"人情世故",这些方面还真不如他的老婆顾佳。

04如何用Python获取弹幕数据

我们使用Python获取并分析了《三十而已》的腾讯弹幕数据,来分析看看哪个角色最受欢迎。分析流程分为以下几步:

弹幕数据获取和数据读入
数据预处理
数据可视化分析

1 数据读入

首先导入所需包。
  1. # 导入库
  2. import os
  3. import jieba
  4. import numpy as np
  5. import pandas as pd
  6. from pyecharts.charts import Bar, Pie, Line, WordCloud, Page
  7. from pyecharts import options as opts
  8. from pyecharts.globals import SymbolType
  9. import stylecloud
  10. from IPython.display import Image # 用于在jupyter lab中显示本地图
  11. 然后使用pandas循环读取数据。
  12. # 读入数据
  13. data_list = os.listdir('../data/')
  14. df_all = pd.DataFrame()
  15. for i in data_list:
  16. # 判断
  17. if i.split('.')[-1] == 'csv':
  18. df_one = pd.read_csv(f'../data/{i}', engine='python', encoding='utf-8', index_col=0)
  19. df_all = df_all.append(df_one, ignore_index=False)
  20. df_all.info()
  21. <class 'pandas.core.frame.DataFrame'>
  22. Int64Index: 271049 entries, 0 to 17637
  23. Data columns (total 7 columns):
  24. # Column Non-Null Count Dtype
复制代码
--- ------ -------------- -----

  1. 0 episodes 271049 non-null int64
  2. 1 comment_id 271049 non-null int64
  3. 2 oper_name 139035 non-null object
  4. 3 vip_degree 271049 non-null int64
  5. 4 content 271049 non-null object
  6. 5 time_point 271049 non-null int64
  7. 6 up_count 271049 non-null int64
  8. dtypes: int64(5), object(2)
  9. memory usage: 16.5+ MB
复制代码
此次一共获取了15集2271049条弹幕数据,每集平均18069条,按照每集平均45分钟计算,每分钟平均401条弹幕,数据预览如下:

df_all.head()

u=661463288,3784685422&fm=173&app=25&f=JPEG.jpg
2 数据预处理

此处对弹幕角色和VIP用户进行处理。

  1. 豆瓣数据# 提取数据
  2. pattern = r'(王漫妮\s*|钟晓芹\s*|顾佳\s*|陈屿\s*|许幻山\s*|飒飒\s*|浪浪\s*):.*'
  3. df_all['danmu_role'] = df_all['content'].str.extract(pattern)[0].str.strip()
  4. # 定义函数
  5. def transform_name(x):
  6. if x=='王漫妮' or x=='顾佳' or x=='钟晓芹' or x=='陈屿' or x=='许幻山' or x=='飒飒' or x=='浪浪':
  7. return 'VIP用户'
  8. elif x=='NaN':
  9. return '未知用户'
  10. else:
  11. return '普通用户'
  12. df_all['danmu_level'] = df_all['danmu_role'].apply(transform_name)
  13. df_all.head()
复制代码
u=1064014537,901451659&fm=173&app=25&f=JPEG.jpg
3 数据可视化

弹幕发送人群等级分布

  1. level_num = df_all['danmu_level'].value_counts()
  2. data_pair = [list(z) for z in zip(level_num.index.tolist(), level_num.values.tolist())]
  3. # 绘制饼图
  4. pie1 = Pie(init_opts=opts.InitOpts(width='1350px', height='750px'))
  5. pie1.add('', data_pair, radius=['35%', '60%'])
  6. pie1.set_global_opts(title_opts=opts.TitleOpts(title='弹幕发送人群等级分布'),
  7. legend_opts=opts.LegendOpts(orient='vertical', pos_top='15%', pos_left='2%'))
  8. pie1.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{d}%"))
  9. pie1.set_colors(['#6FB27C', '#FFAF34'])
  10. pie1.render()
复制代码
用户最喜欢使用的弹幕角色?

  1. role_num = df_all['danmu_role'].value_counts()
  2. role_num.drop(['飒飒', '浪浪'], inplace=True)
  3. # 柱形图
  4. bar1 = Bar(init_opts=opts.InitOpts(width='1350px', height='750px'))
  5. bar1.add_xaxis(role_num.index.tolist())
  6. bar1.add_yaxis("", role_num.values.tolist(), category_gap='5%')
  7. bar1.set_global_opts(title_opts=opts.TitleOpts(title="VIP用户最喜欢使用的弹幕角色"),
  8. visualmap_opts=opts.VisualMapOpts(max_=21027),
  9. )
  10. bar1.render()
复制代码

弹幕角色-王漫妮 词云图
  1. content_series1 = df_all[df_all.content.str.replace(pattern, '').str.contains('漫妮|疏影')]['content']
  2. text1 = get_cut_words(content_series1)
  3. # 绘制词云图
  4. stylecloud.gen_stylecloud(text=' '.join(text1), max_words=1000,
  5. collocations=False,
  6. font_path=r'C:\Windows\Fonts\msyh.ttc',
  7. icon_name='fas fa-heart',
  8. size=653,
  9. output_name='./html/弹幕角色王漫妮-词云图.png')
复制代码
结语:

一直以来在世俗的眼光下,婚姻、事业、家庭,是30+女性绕不开的话题。年过三十,不是结婚生子,就是在结婚生子的路上,但对于没有结婚的很可能被称“大龄剩女”。

近年来,关于女性年龄的讨论更是被推到了风口浪尖。综艺《浪姐》播出后,看到一位位30+的女嘉宾在舞台上"兴风作浪",弹幕中有女生留言“好像没那么害怕变老了“而《三十而已》更是展现了30+女性的不同生活状态和机遇,其实女性的人生,不应该被年龄所定义。

三十而已,年华正好!

无论哪个年龄阶段都有不同的精彩!

u=569162105,203838894&fm=173&app=25&f=JPEG.jpg



关注CDA人工智能学院公众号回复关键字“0727代码获取详细数据代码





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:人工智能 凭什么 告诉你 CDA transform

回帖推荐

gudure 发表于3楼  查看完整内容

《乘风破浪的姐姐》已成为这个夏天最火爆的话题,前有国综"浪姐"高歌猛进,后有这部剧版"浪姐"《三十而已》让人眼前一亮。

沙发
军旗飞扬 在职认证  发表于 2020-7-27 16:46:25

藤椅
gudure 学生认证  发表于 2020-7-27 17:29:47
《乘风破浪的姐姐》已成为这个夏天最火爆的话题,前有国综"浪姐"高歌猛进,后有这部剧版"浪姐"《三十而已》让人眼前一亮。

板凳
时光人 学生认证  发表于 2020-7-27 17:30:54

报纸
西门高 发表于 2020-7-27 18:19:30
支持一下

地板
三重虫 发表于 2020-7-27 18:45:04

7
myazure 发表于 2020-7-28 07:13:43

8
cszcszcsz 发表于 2020-7-28 07:39:38

9
catchywell 发表于 2020-7-28 10:32:10
人可以认知世界,也可以改造世界,说的就是楼上这些回复吧

10
piiroja 发表于 2020-7-28 17:50:00
thx for sharing~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-7 05:13