楼主: whymath
4336 31

[技术讨论与投票] 对论坛价值的数据挖掘工作 [推广有奖]

回帖奖励 140 个论坛币 回复本帖可获得 5 个论坛币奖励! 每人限 1 次
  • 1关注
  • 16粉丝

实习版主

已卖:43份资源

副教授

21%

还不是VIP/贵宾

-

威望
0
论坛币
5811 个
通用积分
708.0583
学术水平
126 点
热心指数
145 点
信用等级
88 点
经验
22480 点
帖子
581
精华
2
在线时间
608 小时
注册时间
2018-5-31
最后登录
2025-10-29

楼主
whymath 发表于 2023-2-5 16:01:22 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
从 2021年2月1日 至 2023年2月1日,站点 "https://bbs.pinggu.org/forum-68-1.html" 下共发布了 1339 个帖子(除置顶的几个推广贴外),共有 24016 人次参与发帖和回复。

我通过网络爬虫获取了这些帖子,以及参与者的一些相关数据,放在附件当中。

请网友帮忙,看看通过这些数据,能挖掘到什么样的价值。即,你需要根据这些数据,自行提问,并编程找到答案。例如:
1. 你发表/回复了多少个帖子?
2. 这两年参与人数最多的帖子有哪些?请列出前十个。
3. 网友们逛论坛的时间有什么规律?

任何有见地的想法都会被鼓励,精彩的答案我将给出积分和论坛币奖励。
Project_bbs_pinggu_20230205.rar (70.5 MB)

对附件的说明
1. ".\data\html" 路径下存放着爬虫获取的原始网页数据;
2. ".\data\sas7bdat" 路径下存放着整理后的数据;
3. ".\prog\setup.sas" 是该项目的环境配置文件,你可根据自己的需要进行修改;
4. ".\prog\spider_getdata_2yr.sas" 是爬虫及数据整理程序文件,你可根据自己的需要进行改写;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据挖掘 sas7bdat pinggu Spider forum

已有 1 人评分经验 收起 理由
arthistory4 + 20 精彩帖子

总评分: 经验 + 20   查看全部评分

查看我的精华帖:免费的 SAS 软件

沙发
lhf8059 发表于 2023-3-2 08:33:04

回帖奖励 +5 个论坛币

谢谢分享

藤椅
lina2006 发表于 2023-3-2 08:36:03

回帖奖励 +5 个论坛币

谢谢分享

板凳
帅de葡小萄 发表于 2023-3-2 10:39:45

回帖奖励 +5 个论坛币

感谢分享 点个赞

报纸
DF89HB6686 发表于 2023-3-2 10:51:19

回帖奖励 +5 个论坛币

谢谢分享!

地板
chengganglee 发表于 2023-3-2 17:28:17

回帖奖励 +5 个论坛币

支持一下了

7
school 在职认证  发表于 2023-3-5 16:45:24

回帖奖励 +5 个论坛币

8
school 在职认证  发表于 2023-3-5 16:45:48

9
末日先驱 学生认证  发表于 2023-3-6 09:00:41 来自手机

回帖奖励 +5 个论坛币

支持一下,感谢分享

10
绿灯警告 发表于 2023-3-6 09:58:24

回帖奖励 +5 个论坛币

谢谢分享

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-7 22:59