- 阅读权限
- 255
- 威望
- 1 级
- 论坛币
- 40750 个
- 通用积分
- 2590.6735
- 学术水平
- 20 点
- 热心指数
- 31 点
- 信用等级
- 7 点
- 经验
- 7098 点
- 帖子
- 20358
- 精华
- 0
- 在线时间
- 11858 小时
- 注册时间
- 2020-12-8
- 最后登录
- 2026-2-7
已卖:21192份资源
好评率:99% 商家信誉:一般
巨擘
还不是VIP/贵宾
- 威望
- 1 级
- 论坛币
 - 40750 个
- 通用积分
- 2590.6735
- 学术水平
- 20 点
- 热心指数
- 31 点
- 信用等级
- 7 点
- 经验
- 7098 点
- 帖子
- 20358
- 精华
- 0
- 在线时间
- 11858 小时
- 注册时间
- 2020-12-8
- 最后登录
- 2026-2-7
 | 开心 2024-10-22 08:20:20 |
|---|
签到天数: 1371 天 连续签到: 1 天 [LV.10]以坛为家III
|
经管之家送您一份
应届毕业生专属福利!
求职就业群
感谢您参与论坛问题回答
经管之家送您两个论坛币!
+2 论坛币
豆瓣电影大数据分析附带爬虫豆瓣对数据处理数据分析可视化含程序源代码
豆瓣电影大数据分析附带爬虫豆瓣对数据处理数据分析可视化.zip
(10.63 MB, 需要: RMB 39 元)
(含采用Python + BeautifulSoup + urllib进行爬虫数据采集的源代码,及相关的分析建模数据)
平台部分主要是hadoop分布式系统,基于该系统融合了组件Spark,Hbase,Hive,Sqoop,Mahout等。继而进行相关的数据分析该项目主要分为以下几部分:1:数据采集主要是基于豆瓣电影的数据,进行分析,所以首先要爬取相关的电影数据,对应的源代码在DouBan_Spider目录下,主要是采用Python + BeautifulSoup + urllib进行数据采集2:ETL预处理3:数据分析4:可视化代码封装完好,适用于对作影视感情分析,影评分析,电影类型分析,推荐系统的建立
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
|
|
|