请选择 进入手机版 | 继续访问电脑版
楼主: 浮世若离丶
14269 86

[学科前沿] 如何使用Recharts绘制动态词云图   [推广有奖]

回帖奖励 81 个论坛币 回复本帖可获得 3 个论坛币奖励! 每人限 1 次
  • 4关注
  • 69粉丝

教授

64%

还不是VIP/贵宾

-

威望
1
论坛币
25044 个
通用积分
98.3144
学术水平
71 点
热心指数
100 点
信用等级
50 点
经验
20419 点
帖子
666
精华
1
在线时间
1301 小时
注册时间
2015-8-6
最后登录
2023-7-5

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
Echarts是由百度开发的一款免费、强大的图表生成和可视化库,使其可以方便地对数据进行展示、交互和定制。

Recharts是基于Echarts开发的R版本,由Yang Zhou和Taiyun Wei开发,通过该包的echartR函数可以完成很多可视化的任务,图表美观且有动态效果,是一款优秀的数据可视化产品。以下是Recharts绘图的知识地图(基本图形):
思维导图.png

百闻不如一见,今天我们使用一则案例来演示使用echartR进行绘图的流程。

一、举例Showcase
“世界很复杂,百度更懂你”。百度搜索风云榜以数亿网民的单日搜索行为作为数据基础,以关键词为统计对象建立权威全面的各类关键词排行榜,盘点中国最新最热的人、事、物信息,为最具代表性的“网络风向标”。
百度热词榜.png


我们想通过从百度热词榜获取热词并通过词云的形式实时展现网名关注的人、事、物。

二、前置准备
1.本机测试环境:R最新版 R3.4.4

2.Recharts安装与加载方法
1.png


三、echartr词云WordCloud语法介绍
2.png


四、正式绘图
1.数据准备
从百度热词榜获取热词,并解析为数据框,包含热词和频数。为此构建一个函数getBaiduHot,解析_百度热词趋势_ 网页。

3.png


预览一下数据集前十位:

5.png


3. 基本图形绘制
只要提供x和y

4.png


制图结果如下:

6.png


上图根据关键词和词频绘制了Top30的百度热词,抓取的时间是2018-3-18 12:44:08。可以看出网友比较关注的话题有娱乐话题、政治话题、生活话题、体育话题等。如“姚笛被成功求婚”、”iPhoneX撒一地”、”中超一方最差开局”等等。

4. 按数据系列着色
我们希望将热词分组。定义一个series变量’Trend’。’rise’系列和’fall’系列用不同的颜色标注。

7.png


绘制结果如下:

8.png


5. 带时间轴With Timeline
比较实时热点、今日热点和七日热词趋势。
首先,获取今日热点和七日热点两个榜单的网页并转为数据框,合并。

9.png


然后作图:

10.png


效果如下:

11.png


备注:此图为动态图片,可以通过拖动X轴动态展示实时热点、今日热点和七日热词趋势。

6. 设置主题setTheme

12.png


设定主题背景和调色板颜色。效果如下:

13.png


熟悉此案例之后,你可以通过R来抓取公开网页的词语(需要注意合法性的问题)并进行动态词云展示。EchartR的语法并不复杂,通过简单的几行命令即可实现强大的自定义可视化图表制作。

这个正式R最吸引人的地方,它可以用几行简单的代码生成图表和图以及完成强大的任务功能。同时作为开源工具,目前尚无行业应用限制,方便的拓展性,不仅可以同Python,Java,C,C++等语言进行互调,其他统计软件也大部分均可调用R,如SAS,SPSS statistic等。

广告插播
如果你对R语言进行数据分析感兴趣,欢迎参加CDA业务数据分析师-R语言专题课程。
课程通过R语言基础、数据提取、数据处理、统计分析、数据建模、数据可视化等体系学习,介绍了R语言及数据分析与挖掘的各个技术细节。通过实际的金融、电信、市场调研、客户关系等案例演练,让学员真正体验数据分析与R语言的魅力。

R语言最近开课:
(CDA LEVEL I R 数据分析)

一、课程信息
北京 & 远程:2018年03月24日~04月22日(四周线下&直播) + 两周线上
授课安排:现场班6900元,远程班4900元
(1) 授课方式:面授直播两种形式,中文多媒体互动式授课方式
(2)授课时间:上午9:00-12:00,下午13:30-16:30,16:30-17:00(答疑)
(3)学习期限:现场与视频结合,长期学习加练习答疑。

二、报名流程
1. 在线填写报名信息
(北京&远程)
2. 给予反馈,确认报名信息
3. 网上缴费
4. 开课前一周发送电子版课件和教室路线图

三、课程大纲
第一阶段:数据分析概念与R编程
第二阶段:数理统计与SQL数据库
第三阶段:数理统计与数据可视化
第四阶段:统计推断与精益管理
第五阶段:市场分析方法与模式识别模型
第六阶段:客户分析方法与分类模型
第七阶段:时间序列与综合案例
第八阶段:综合案例分析
第九阶段:[线上选修]Mysql数据库基础知识(一周)
第十阶段:[线上选修]Tableau数据可视化(一周)

如果你有R语言统计分析和业务分析的基础,对R数据挖掘和模型的知识有兴趣,也欢迎报名参加R数据挖掘的课程:
http://www.cda.cn/kecheng/31.html
1级2级连报更有8折优惠!

四、课程讲师
程老师
CDA数据分析研究院讲师/中国人民大学经济学博士
多年数据挖掘及可视化实战经验,参与科研课题近20项,发表中英文论文近30篇。曾获得“汇丰杯”中国高校SAS数据分析大赛冠军。翻译或参与编写《商务与经济统计》、《R语言编程艺术》、《大数据挖掘与统计机器学习》等多部著作。
  
曾珂
管理科学工程硕士/CDA数据分析研究院讲师
现为第一车贷金融产品部数据挖掘工程师,精通Python与R语言数据挖掘,研究方向为互联网、电子商务数据分析与挖掘,擅长基于客户关系管理的数据挖掘、数据可视化、文本挖掘。

五、课程优惠
1. 全日制在读学生8折优惠(需提供学生证件证明);
2. 参加过论坛其他现场班老学员9折优惠;
3. 同一单位三人及以上9折优惠,五人及以上8折优惠;
4. 同时报名参加LEVELⅠ和LEVEL Ⅱ享受8折优惠。

联系我们
课程顾问:
陈老师18010006628(微信)
邮箱:chenwenjing@pinggu.org

阅读原文:https://www.cda.cn/kecheng/43.html



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


4.png
已有 4 人评分经验 论坛币 收起 理由
刘彦楼 + 100 精彩帖子
残阳_等待 + 100 精彩帖子
我的素质低 + 100 精彩帖子
jiangbeilu + 11 精彩帖子

总评分: 经验 + 300  论坛币 + 11   查看全部评分

CDA LEVEL I R 数据分析  北京 & 远程 3.24日开课 欢迎参加!

使用道具

Still.. 企业认证  发表于 2018-3-19 11:33:36 |显示全部楼层 |坛友微信交流群

回帖奖励 +3 个论坛币

支持!R可以用几行简单的代码生成图表和图以及完成强大的任务功能,目前在学术界、商界应用的都很广泛

使用道具

Mirror.. 在职认证  发表于 2018-3-19 11:36:55 |显示全部楼层 |坛友微信交流群

回帖奖励 +3 个论坛币

CDA LEVEL I  R 语言课程,3月,4月,欢迎联系!!!!

使用道具

PLMKI 发表于 2018-3-19 11:45:46 |显示全部楼层 |坛友微信交流群

回帖奖励 +3 个论坛币

支持,很好的课程,学习

使用道具

cheetahfly 在职认证  发表于 2018-3-19 12:11:48 |显示全部楼层 |坛友微信交流群

回帖奖励 +3 个论坛币

内容有干货,很实在。

使用道具

rossrachel 发表于 2018-3-19 13:06:09 |显示全部楼层 |坛友微信交流群

回帖奖励 +3 个论坛币

学习学习!

使用道具

cszcszcsz 发表于 2018-3-19 13:36:30 |显示全部楼层 |坛友微信交流群

回帖奖励 +3 个论坛币

谢谢楼主!

使用道具

judaise 发表于 2018-3-19 14:03:07 |显示全部楼层 |坛友微信交流群

回帖奖励 +3 个论坛币

谢谢推介!

使用道具

auirzxp 学生认证  发表于 2018-3-19 15:14:34 |显示全部楼层 |坛友微信交流群

回帖奖励 +3 个论坛币

学习一下

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-18 16:26