作者简介:
2015年度十大科技创新人物、百万级畅销书《大数据时代》中文版译者、中国大数据领军人——周涛
天才神童。1岁说话,1岁半识字,2岁学象棋,3岁打麻将,4岁看武侠小说……26岁获得教育部自然科学一等奖,27岁获聘电子科技大学正教授,29岁获得中国青年科技奖。
学术达人。在《物理报道》(Physics Reports)、《美国科学院院刊》(PNAS)、《自然通讯》(Nature Communication)等国际SCI期刊和SIGKDD、ICDM等国际学术会议发表论文300余篇,引用13000余次,H指数为55。入选Elsevier全球最具影响力中国学者名单(物理天文类)。
数据少帅。电子科技大学大数据研究中心主任,百万畅销书《大数据时代》中文译者,全国最大的数据挖掘竞赛平台Data Castle的创始人,“2015年度十大科技创新人物”获得者。
商业玩家。白手起家,先后创立了数之联、数联铭品、国信优易等知名大数据企业,创立和投资的大数据企业总市值过百亿。
目录
自序:在麻瓜和魔法师之间做出选择
Part.1 大数据时代,用数据说话
01 从万物皆数到万事皆数 / 005
主动或被动,我们都是数据贡献者
一切都被记录,一切都被分析
四大方面,让数据指数级增长
02 从十数九表到数态万千 / 017
结构化数据
非结构化数据
03 从隔水相望到阡陌交通 / 029
地点数据
个人数据
数据与数据,1+1远大于2
大数据创新实践:
用购买记录给用户画像
04 大数据和云计算驱动新工业革命 / 039
计算:第三次工业革命中的新能源
数据:第三次工业革命中的新材料
证析:第三次工业革命中的先进工艺技术
个性化:大数据时代最显著的商业特征
大数据创新实践:
一张失败的公交卡
个性化医疗,安吉丽娜·朱莉和史蒂夫·乔布斯
Part.2 大数据1.0:分析
05 统计呈现洞见 / 055
抓出非法的MCC套用
打击“电老鼠”
“抓获”过度医疗和骗保行为
识别社交网络中的垃圾用户
新浪微博面临的三大问题
快递员的通话记录蕴藏哪些商机
付费节目点播最多的是什么
06 关联蕴含价值 / 075
关联规则挖掘
协同过滤
关联分析是寻找因果关系的利器
大数据创新实践:
谁最关注超声波洁面产品
发现“一月三电号”僵尸用户
07 预测指导决策 / 089
点击购买类预测
基于移动轨迹的位置预测
链路预测
大数据预测的主流方法是什么
大数据创新实践:
一张信用卡逾期不还款的概率有多大
签到记录预测用户的土著化指数
Part.3 大数据2.0:外化
08 寻求外部数据的帮助 / 109
从行为数据预测学生考试成绩
从食堂打卡记录中“定位”孤独人群
从社会计量标牌洞察人力资源管理
预测离职率和升职率
行为数据让非法集资无所遁行
09 自身数据的外部价值 / 129
45个关键词实时预测流感趋势
阿里巴巴的“淘CPI”指数
10 机器学习,数据外化最神奇的利器 / 139
机器学习三板斧1:特征
机器学习三板斧2:模型
机器学习三板斧3:融合
Part.4 大数据3.0:集成
11 交易市场:数据资源的汇聚地 /155
科研数据共享
政府数据开放
全国可流通数据的目录体系
12 数据城堡:数据人才的竞技场 / 175
Kaggle,数据科学之家
数据城堡,Kaggle模式的中国尝试者
13 创新工厂:数据技术的嘉年华 / 185
大数据创业公司困境
大型传统企业信息化的难题
构建大数据挖掘平台
建设大数据创新工厂
结束语 成为大数据企业 / 201
致谢 / 211
为数据而生 -周涛.pdf
(56.14 MB, 需要: 9 个论坛币)


雷达卡







京公网安备 11010802022788号







