CDA数据分析就业班毕业答辩会——诚邀专家评审与大众评审
时间:2016年3月24日
地点:北京市海淀区厂洼街三号丹龙大厦B座三层
答辩详情:CDA数据分析就业班第三期共44名学员,经过学习统计理论、数据挖掘理论、EXECL、
SQL、SAS、Python等软件、大型商业案例后,将以4人一个小组的形式参加答辩。
答辩命题:难度系数由低到高
难度系数9.0(数据量20万条):
国内某大型广告公司的一项按照点击收费的数据
工作内容:
1 、找出作弊(刷点击量)的用户
2 、并发掘这些用户都有什么特征属性
3 、提出改革建议,如何规避用户作弊(刷点击量)
难度系数9.5(以下两道选题任选其一):
一、电子商务网站用户行为分析与服务推荐
互联网经历了门户网站、信息搜索两个阶段,即将到来的下一个阶段是以推荐为主的运用。
与搜索引擎不同,推荐系统不需要用户提供明确的需求,而是通过分析用户的历史性为,主动地
向用户推荐满足其需求或激发其兴趣的信息。
我们提取了某家法律网站的“http://www.lawtime.cn/beijing”,该网站提供法律信息与咨询
服务,并为律师和律师事务所提供互联网整合营销方法。在运营过程中发现只有少数网页被
经常浏览,其他大量的网页很少有人访问,既存在所谓的“长尾效应”。
提供给大家MariaDB10.0.17(http://mariadb.org/en/)格式的数据中收集了用户浏览行为数据。
数据名称为“7law.sql”,需要大家自行导入并进行分析。软件随意,但是业界使用Python的居多。
工作内容:
1、 对数据进行探索,发现客户浏览网页的行为习惯;
2、 归纳这类分析的文献,要包括算法、商业运用案例、效果评估等方面;
3、请制定推荐策略和实施方案如何降低长尾网页的数量
4、制定检验模型运行效果的策略
二、电商产品评论数据情感分析
了解客户对产品的评价一直是品牌制造企业关心的。电商的客户评价功能为这类分析提供不错的资料。
我们采集了来自京东的客户评价数据(示例http://item.jd.com/1106432.html#comment)
数据存放在“huizong.csv”文件中。软件随意,但是业界使用Python的居多。
工作内容如下:
1、 分析某一品牌热水器的用户情感倾向;
2、 从评论中挖掘该品牌热水器的优点与不足;
3、 提炼不同品牌热水器的卖点。
难度系数10(无数据):
背景:
大数据时代一家培训公司,想要让自己的培训产品招到更多的学生。想要从网络空间用户下更多力度。
这家公司想做什么?
工作内容:
1、这家公司想了解都什么要的人群关注自己的培训?
2、有多少家竞争机构?
3、用户更佳喜欢什么样的培训形式
4、关注此类培训的用户有什么行为偏好?
5、提出运营建议?
提示:数据分析、数据挖掘、大数据等等关键词的百度指数
各家网站的信息可以通过爬虫技术获得
樊老师是资深的相关信息持有者可以咨询
答辩安排:
2016年3月24日上午9:30分开始CDA数据分析就业班毕业答辩开始,到场嘉宾包括5位专家评审团、
企业评审团、大众评审团、参加答辩CDA数据分析就业班第三期学员。
当日9:45一共七个现场组及四个远程组参加答辩每个小组答辩时长10分钟,专家评审团提问5分钟,
企业及大众评审团5分钟问答。
每个小组答辩后均到新闻报道区接受采访,采访结束后到场有人才需求企业可以直接进行现场面试。
所有小组答辩结束后将由工作人员汇总讲师讲师及大众评审得分评出最佳小组,颁发奖金及毕业证书。
诚挚邀请:此次CDA数据分析就业班毕业答辩内容充实,具备较大的专业程度。
1、诚邀有数据分析及挖掘人才需求的企业莅临现场指导并开展人才合作。
2、诚邀想要学习或交流数据分析及挖掘技术的个人莅临担任大众评审工作。
3、诚邀行业大牛担任此次答辩专家评审。
请有意向参加CDA数据分析就业班毕业答辩的企业、专家、个人,将企业或个人简介、联系方式、具体需求发送邮件至fanyuliang@pinggu.org。
本次答辩会咨询及招商赞助工作负责人:
樊宇亮
电话:010-68472707
邮箱:fanyuliang@pinggu.org