楼主: wangxiyue123
1387 0

[Hadoop] 揭开ZF大数据应用的面纱 [推广有奖]

  • 0关注
  • 3粉丝

等待验证会员

博士生

63%

还不是VIP/贵宾

-

威望
0
论坛币
798 个
通用积分
0
学术水平
0 点
热心指数
3 点
信用等级
0 点
经验
2450 点
帖子
162
精华
0
在线时间
26 小时
注册时间
2015-9-22
最后登录
2015-10-22

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

  “大数据将从一个时髦的概念走进我们生活中的方方面面。帮助我们更好地认识世界,认识自己,构建全新的社会关系。”清华大学数据科学研究院执行副院长韩亦舜说。

  “《关于促进大数据发展的行动纲要》(以下简称《行动纲要》)标志着大数据在我国的发展与应用已经上升到国家战略层面。”赛迪顾问分析师卢敏说,“《行动纲要》明确指出推动政府大数据开放、共享和安全的重要性。而要使《行动纲要》中的内容尽快成为促进大数据发展和推进大数据应用的实际行动,还有很多问题要解决。”

  数据潜在利用价值高

  《行动纲要》涉及三个关键词:共享、开放、安全。卢敏指出,三个关键词背后指向三个问题:“共享”指向为什么要加快政府大数据公开的进程,“开放”指向企业创新的动力源在哪里,“安全”指向如何保护个人隐私和信息安全。

  “政府大数据公开的目的是改善民生,企业创新的目的是促进结构转型,信息安全建设的目的是完善法律。三个关键词分别指向社会、经济、法律等不同领域。由此看来,大数据产业牵一发而动全身。”卢敏说。

  共享、开放、安全的出发点和落脚点都指向政府大数据的开放共享、研究与应用、示范影响效应等。我们不禁要问,政府大数据的价值究竟何在?

  就数量而言,BAT(百度、阿里、腾讯)拥有数以亿计的用户量,但这与政府大数据规模相比,可谓小巫见大巫。卢敏介绍说:“粗略估算,全国政府大数据加起来至少也有数百甚至上千个阿里巴巴的体量。”

  至于政府大数据的质量,则可以通过和BAT企业对比来说明。据介绍,百度拥有庞大的用户搜索记录,每个网民都会留下众多记录,但这些数据较为单一,不进行关联应用就无法显示价值;腾讯的优势在于拥有数以亿计的QQ和微信用户量以及更庞大的社交数据,但这些数据目前仅局限于营销应用;阿里的交易数据似乎价值更高,但也只是局限在电商领域以及外延应用。“BAT的共同短板在于数据种类的单一化程度较高。”卢敏说。

  政府大数据涉及工商、税务、司法、交通、医疗、教育、通信等等领域,数据的种类繁多,关联性强、统计规格较为统一,便于应用处理。九次方大数据创始人王叁寿曾表示“政府的数据事关百姓生活的方方面面,数据的利用价值也最高”。

  开放标准待建立

  真正的大数据除了量大,另一个特点是变化多,如图片、视频、大段文字这些不能用数字化处理的数据,属于非结构化数据。只有非结构化的数据才更具有开发价值。

  政府的很多数据,例如人口、户籍等,属于结构化数据,离非结构化的大数据概念还有一定距离。但就目前阶段来看,政府推动大数据产业发展仍有现实意义。

  通过与大数据紧密相连的互联网,在市民服务设施众包、提高政府监督职能等方面,百姓能够参与进来。“政府信息的开放共享,有助于提高政府的公信力。”韩亦舜说。

  政府数据的开放,不但能帮助政府提高自身透明度并提升治理能力和效率,也是促进经济发展和社会创新的重要推力。然而,在政府数据资源共享开放工程当中,数据的开放程度与开放内容的标准,目前似乎并没有定论。

  复旦大学国际关系与公共事务学院副教授郑磊在《中国开放政府数据平台研究:框架、现状与建议》一文中提出,经过样本的数据采集分析,截至2015年5月,各地开放政府数据实践共计公开了1963个数据集。其中公开数据最多的是武汉(635个),最少的则是贵州(17个)。

  努力打造大数据产业新高地的贵州,在政府数据开放方面面临着新的挑战。

  郑磊指出,中国开放政府数据实践存在的问题主要有目前开放的数据量少、价值低、可机读比例低,开放的多为静态数据,数据授权协议条款含糊,缺乏便捷的数据获取渠道,缺乏高质量的数据应用,缺乏便捷、及时、有效、公开的互动交流等。

  “《行动纲要》为信息开放共享指明了出路,但是政府大数据如何应用,还要看接下来的行动和规则制定。”卢敏说。

  针对问题,郑磊建议加强管理架构建设,制定相关政策与工作机会,提高领导支持能力,基于社会需求开放高价值数据、展现数据应用,提升数据开放性与可机读比例,规范数据更新周期,落实数据更新工作,完善数据授权协议,降低数据获取与互动门槛,推动有效公开的沟通。

  数据利用如何破冰

  目前,一些发达国家政府在数据开放方面走在了前面,甚至把数据开放当做执政自信的标志,公开一些政府日常消费方面的支出供市民监督。

  我国政府数据利用方面特别是数据共享方面确实存在一些误区。一方面说到开放就好像完全没有隐私,另一方面安全问题又成为了数据开放的最大障碍。

  韩亦舜认为,政府数据开放要在实践中摸索前进。先把政府部门内部及部门之间数据共享的工作做起来。对社会的数据开放共享,先从方便百姓生活又不是很敏感的数据开始。特别是涉及公共安全、公共利益的数据,提供公共服务的机构或企业有义务在一定前提条件下开放,“这样一些可以预警、预防的群体性事件就能够避免”。

  韩亦舜指出,按照流行的大数据的几个“V”(大量、高速、多样、价值)或者多源异构的定义来衡量,政府的部分数据,还属于结构化数据,离大数据概念还有差异。但没有必要拘泥于大数据的定义,只要政府充分运用数据的挖掘利用,如建设协成智慧无线智慧WiFi城市应用其WiFi广告WiFi营销,提高政府治理能力,提高科学决策能力,受益的将是全社会。

  在政府开放数据方面,韩亦舜建议,各级政府都以数据应用为导向,需要什么数据就共享什么数据。虽然,与大数据的开发共享还有距离,但确实是数据应用的可行路径。

  韩亦舜说,相信越多的人从数据开放中获益,就会有更多的人愿意开放数据。

  背景资料

  《关于促进大数据发展的行动纲要》

  主要内容及对产业的部署

  《行动纲要》的内容可以概括为“三位一体”,即围绕全面推动我国大数据发展和应用,加快建设数据强国这一总体目标,确定三大重点任务:一是加快政府数据开放共享,推动资源整合,提升治理能力;二是推动产业创新发展,培育新业态,助力经济转型;三是健全大数据安全保障体系,强化安全支撑,提高管理水平,促进健康发展。围绕这“三位一体”,具体明确了五大目标、七项措施、十大工程。并且据此细化分解出76项具体任务,确定了每项任务的具体责任部门和进度安排,确保《行动纲要》的落地和实施。

  五个目标:一是打造精准治理、多方协作的社会治理新模式;二是建立运行平稳、安全高效的经济运行新机制;三是构建以人为本、惠及全民的民生服务新体系;四是开启大众创业、万众创新的创新驱动新格局;五是培育高端智能、新兴繁荣的产业发展新生态。

  七项措施:完善组织实施机制、加快法规制度建设、健全市场发展机制、建立标准规范体系、加大财政金融支持、加快专业人才培养、促进国际交流合作。

  十项工程:政府数据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程、公共服务大数据工程、工业和新兴产业大数据工程、现代农业大数据工程、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力提升工程、网络和大数据安全保障工程。

  按照国务院的部署,工业和信息化部主要负责推动大数据产业发展,培育新兴业态,助力经济转型,包括推进大数据核心技术攻关、健全产品体系、完善产业链和发展环境、推进工业及新兴产业大数据应用,同时做好信息安全和规范管理等的相关工作。重点组织实施十大工程中的“大数据关键技术及产品研发与产业化工程”“大数据产业支撑能力提升工程”“工业和新兴产业大数据工程”三项工程。


*源自搜狐媒体平台


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:大数据应用 大数据 工业和信息化部 结构化数据 产业化工程 清华大学 赛迪顾问 关键词 分析师 研究院

已有 1 人评分论坛币 收起 理由
daazx + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-25 21:41