- 全国高考作文题目18卷中12卷的作文方向被百度大数据预测命中,截止17日已开场的14场世界杯胜率预测中命中10场,机器完成如此高的准确预测确实令人咋舌。那么机器预测的正确性又是通过什么来保证的呢,这里一起解析。
被媒体称为“首届大数据时代的高考”刚刚结束,细心的网友就发现,全国高考作文题目18卷中12卷的作文方向被百度大数据预测命中,被网友戏称“神预测”。以上海市为例,2014年上海卷高考作文题为“自由与不自由”,在百度大数据预测的出题概率第二大作文主题“生命的多彩”中,恰好命中作文关键词“自由”。
借助高考这个牵动亿万中国人心的全民聚焦事件,基于大数据和人工智能的大数据技术再一次走入了公众的视野,这将是引爆技术变革的蝴蝶效应吗?
大数据+机器学习
搜索是百度的立足之本,关注的焦点必然是人与信息的连接,拥有海量的数据。作为搜索引擎,百度首先收集互联网上的全网综合数据,然后将这些数据整理、分析,最终通过大规模机器学习和深度学习等人工智能技术,让系统拥有预测的能力。
当赋予机器以名师教学经验和优秀范文等多维海量数据,再匹配上精准的计算模型和数据算法,基于人工智能的学习技术,机器就可以模仿“人脑”来预测作文题目。于是,基于海量数据的预测,有着人类无法比拟的优势。
有兴趣的话,可以关注一下 百度预测网站,2014世界杯预测结果已然出炉,结果是否准确,答案即将揭晓。
关于百度神预测
百度大脑基于人工智能技术来模拟人脑思维,通过对信息、人、物理世界的感知,在高性能计算的基础上,进行思考,做记忆关联之后,进行决策、行动和创造。
- 从功能的角度来说,百度大脑的作用就是让用户能够与机器进行自然的交互(如通过声音、图像识别等方式),让机器更好地理解用户的需求,完成信息与用户需求的精准匹配
- 从技术的角度来说,百度大脑是基于大规模机器学习、深度学习技术,用计算机模拟人脑神经网络,通过多层的学习模型和海量的训练数据来完成数据智能
神预测的基础
1. 神经网络规模。百度具有全球最大规模深度神经网络,拥有200亿个参数。网络层数多达10层,其参数复杂度几乎超过现存的任何多媒体领域用到的数学模型,能够处理的特征向量数目上千亿。
2. 技术团队。从2013年百度深度学习研究院成立,世界顶级专家纷纷加盟,包括“千人计划”国家特聘专家余凯、美国新泽西州立大学统计系教授张潼、前AMD异构系统首席软件架构师吴韧、前Facebook资深科学家徐伟等。2014年5月19日,百度宣布任命人工智能领域最权威的学者之一、“Google Brain之父”吴恩达博士为百度首席科学家,全面负责百度研究院,被业内评价为“中国互联网公司迄今为止引进的最重量级人物”。
3. 商用范例。百度的深度学习技术已被应用在语音、图像、文本识别、自然语言处理和CTR预估等方面,取得显著的成效,有效提升业务性能和用户体验。
4. GPU并行计算平台规模。百度自主研发世界最大规模的GPU并行计算平台,支撑深度学习系统,突破了深度学习算法并行化的世界难题。
Machine vs. Human
百度高级副总裁王劲表示,根据摩尔定律,继续做十年、二十年的话,基于海量数据的人工智能很有可能就会比人脑更聪明,那时候质变就会发生。
在预测方面超越人类或许并不是危言耸听,现在已经有所端倪,例如无人驾驶汽车、智能机器人可以代替酒店的行李员,帮你拿行李。但是再过五年、十年,将有更多的事情可以通过机器,以互联网的方式来做,生产生活将发生巨大的改变。
来源:CSND