2017年中国数据分析师行业峰会:
大数据与交通旅游_分会场(八)
大数据与交通旅游
时间:2017年7月29日 下午
地点:北京·中国大饭店
陈清凝:尊敬的各位来宾,女士们先生们大家下午好!这里是CDAS2017第4届中国数据分析师行业峰会—大数据与交通旅游分论坛的现场,我是主持人陈清凝。非常高兴能够主持“跨界互联,数聚未来”CDAS2017中国数据分析师行业峰会。首先,我也谨代表大会主办方对大家的到来表示最热烈的欢迎以及最诚挚的感谢。
现在的社会是一个高速发展的社会,科技发达,信息流通,人们之间的交流越来越密切,生活也越来越方便,大数据就是这个高科技时代的产物。现在大数据成为各个企业的资产,基于大数据的商业宾隔夜将造就千亿级的市场。今天下午我们将围绕大数据与交通旅游这个板块跟大家进行分享。首先让我们有请IBM大数据分析算法研发高级经理杨继辉先生上台演讲。
杨继辉:首先感谢主持人的介绍和CDAS论坛给我们这样一个机会让我跟大家一起分享。我叫杨继辉,在IBM这边负责大数据分析算法研发,我们的团队主体做算法研发的有100多人,我们做的是通用算法,可以在各个行业充分的使用,交通只是其中一个行业。今天下午利用这个机会分享一下我们最近这段时间和IBM的合作伙伴在国内某个城市里做的基于交通相关多源大数据融合,解决整个城市拥堵、道路规划方面的挑战我们做的结果,分享一下我们的经验,也有教训,希望大家能够有所收获。
说一下背景,我们为什么要做这样一件事情。图上的场景大家很熟悉,国内的一线城市、二线城市基本上都是这个套路,人口会持续的涌入,城市也会越来越大,路修的越来越多,但是感觉有时候人越多,路修的越多,结果是路变的更堵,有些是没规律的堵,甚至是无序的。在座的各位今天从你们住的地方到这儿,大概多长时间?一个小时、一个半小时、两个小时可能都有,我从家里过来,我从家里到公司是一个半小时,从家里到这儿是50分钟,我早上来的时候我看百度提示的是30分钟能到,实际上用了50分钟。
与交通相关的事情非常多,平常的出行背后参与的主体非常多,像最重要的交通管理部门中的交通规划、交通管理、交通参与主体,比如说汽车、公交、轨道,以及所有的参与个体。在这样一个庞大的系统里面,想要把它做的很顺畅,或者说想要在中间挖掘出交通运行的规律,以及问题,以及解决这些问题的方法或者先分析出来这些问题的根源在哪儿,目前来看是一个非常大的挑战。因为随着大数据的来源越来越多,现在看来数据有时候不是问题了,而基于这个数据怎么做分析,分析出来的结论是否真的能够提供一些 深刻的洞察,并且基于这些结论可以采取措施的东西呢?反而更有挑战。所以我们才和合作伙伴有这样一个机会针对国内某个大城市得到了非常多源的数据,做了一个工程。
第一,多源数据融合思路
交通相关的数据来源非常多,我们如何把这些多源数据结合起来,做大数据分析,数据来源的融合非常重要,没有多源数据,机遇单源数据也可以做,多源的数据会让整个形势,或者全局的势头更清晰,这个挑战非常大。
这个项目里我们可以得到数据是因为我们跟合作伙伴以及在这个城市里一些得天独厚的条件,跟我们合作的部门是一个交通规划部门。基于政府的优势,或者说市政府的规划,把交通相关的归口数据由交通规划部门统一汇总。至少可以访问所有交通相关的数据,梳理之后分为四类。
一是交通的运营数据。比如说最常见的卡口数据,也就是路上经常看到的摄像头拍的数据,这些数据会做后续的处理,做成结构化数据。RFID数据,在这个城市关键的路口或者是特定的地点,所有的车辆经过那儿都会有一个信号,在当初设计的时候是为了安防的需求,城市安全管理的需求,但是它对于我们做交通管理有很大的帮助。车联网数据,比如说百度、高德,还有基于政府机构的车辆网络信息。轨道交通、GPS、手机信令等方方面面的信息都作为交通参与的主体的基础数据,都会对做交通分析有很大的帮助。
二是交通设施数据。这些是静态的数据,这些数据也随着时间的推移在变化,只是这些变化不是实时的。比如说轨道、公交、道路的会合、分岔等等,这些信息对交通是非常有用的信息。
三是交通规划数据。大家天天吐槽为什么路越修越多,反写越来越堵呢?有时候第一言看到问题都会说,规划怎么这样子呢?事实上很根源的问题在于规划上,但是规划部门的苦水也很多。关于规划,包括道路的规划用途、地块儿的规划用途对交通的影响非常大,如果说我们能够提前拿到这些信息,帮他们做一些分析,甚至拿以前的历史规划,以及历史的交通状态做一些分析,能够从中捉到现状好的地方、不好的地方,对将来的规划会有很大的帮助。
四是交通地理数据。
我们拿到了这么多交通的多源数据以后,做的大数据分析项目最典型的流程是先要做数据的清洗和梳理,要对数据进行融合,融合之后再基于我们想解决的某个问题对整理过的数据进行建模、分析、验证、规划、部署。
拿到数据以后第一个需要关注的就是数据质量,虽然我们拿到了很多数据,现在我们拿到到的是出租车的GPS和车联网的数据。大家觉得有了GPS什么事儿都解决了,实际上并不是这样,GPS数据在一些常见的情况下会很好,但是其中会出现很多异常的数据,比如说碰到隧道、轨道、地铁等等,基本上就没法得到实时的数据。这是第一个基本量的问题。第二个是覆盖范围,RFID路网分布间隙大,这是覆盖范围的问题。第三个是缺失值,各数据都有不同程度的缺失值。
数据的融合最基本的事情是什么?拿到了这么多复杂的数据,是不是拿到以后就开始做,还是需要做前期的预处理?我们的思路是,要在做交通分析的话,首先要对交通的基本特征做梳理,这个梳理是做数据融合的第一步。数据有一些问题,我们如何拿多源的数据进行互相验证?比如说GPS有缺失值,我们能不能补充它。GPS数据不全,RFID是否可以做补充?第二个是统一数据,我们在做数据分析预测的时候基本的策略是要把多源的数据融合起来做一张大表,这张大表如何能既有运营的数据,又有平常意义的主数据。也就是说交通参与的主体如何能够识别?从整体来讲,交通流量里面的信息我们出河能够把它汇总出来?我们要做好统一数据的融合。这个基础上,我们会对所有交通路段里面的交通参与主体,现在分析的主体是机动车辆(不包括摩托车),在这个路段里的刻划指标。最基本的是平均速度,要把这个事情刻划的更全面,会设计出更多的指标,比如说在这个路段里面的平均行驶时间,我们会把一个长路段基于物理的特征划分成小路段,这个路段里分析哪个小的单元里的各个特征,平均速度、平均行驶时间、拥堵的长度,拥堵长度随着时间的推移是动态的,也许是3分钟、5分钟。以及拥堵点的起始位置,因为拥堵总有拥堵源。在行驶的过程中,低速占比时间是多少,这个道理上一开始进入这个路段的时候很好,但是走一段时间就堵了,堵过了这个时间又不堵塞乐观,更多的时候是针对长路段是这样,短路段有可能进去就是堵,出来的时候还是堵。基于统一的融合数据之外做了处理之后,就可以开始下一步的分析和建模。
第二,如何做模型以及设计系统。
为什么要做这样一个系统呢?我们在做任何大数据分析项目的时候,都有几个核心的问题,为什么这么做,到底要做什么,要怎么做?这个项目中主要是为了交通规划,以及交通管理部门在整个城市交通管理中他们需要去关注的一些事件或者说特殊的需求。
建立这样一个平台,并不是为了当前需要什么就要做这几个事情,满足需要就够了。为什么我们要做一个平台,构建这样一个系统,满足现在的需求?我们考虑的是不单单满足现在的需求,而是要考虑到交通规划、交通管理这两个大的范畴,如何解决将来相似的问题。构建这样一个系统可以帮助我们在三个层面上看这个事情。作为这个部门归拢了这么多的数据,光看一看这些数据,探索一下,不是这个部门需要的,也不是政府部门归拢这些数据的目的,而是要分析数据背后的原因,为整个城市的政府管理,包括规划、交管、交通出行指导方面做统一的长远的规划,所以首先要做数据研究。之后要在研究的基础上发现这些数据里面的洞察信息,包括规划方面的信息,规划是一个最大的痛点,第二方面就是交管。有了这些信息可以为全方位的深入分析做基础。最后可以为辅助决策做支撑,将来的规划如何避免之前发生的问题,如何在交通管理中为大家设计更好的信号灯等等。
做什么呢?这块儿将来可做的事情非常多,眼前是基于几方面的内容做深入的探讨和分析。
1.路段指标的形成。
我们天天在拥堵中经过,也觉得习惯了,反正那个地方就是堵,我们瞄一眼就能看,比如说在高速公路的入口,发现三条道突然变成两条道,可能每天就在那儿堵。开一个星期、半个月心里就非常清楚一天在这儿要堵多长时间。这些拥堵事件如何去识别它?刚才举的例子是很浮浅的例子,如何让它自动的在城市范围内做这个事情,就不是特别直观了。
2.拥堵事件的自动识别
3.常发拥堵识别
4.拥堵模式分析
5.拥堵的预测报警
架构不花时间讲了,就是对基础的硬件环境,以及大数据平台,加上我们做的通用模型、业务模型,最后上层是针对某些特定的应用做深入的分析和展示。
第三,工程实践结果分享
我们会在通用模型中选择适当永远我们做的,IBM会根据时间序列和空间分析的算法,在这个基础上结合业务模型做,我们会做一些初步验证之后,再用批量的大数据做,最后再做部署。
我们会针对这些算法模型做迭代式的开发,不是把所有的事情同时做,这种迭代会是非常频繁的,也许半个月,一个月就会针对原有的数据分析出来结果,之后会根据更多的数据来源做迭代式、渐进式的改进。
成果分享:一是关于拥堵趋势的分析和拥堵模式的分析。这块儿主要是做历史规律的挖掘,提供拥堵趋势或者规律的全局视图,给交管部门或者是交通规划部门。二是短时预测和异常监测。短时预测是根据现在的状况和历史的状况做30分钟之内的道路车速的预测,基于这个会做异常的监测,是说平常这个地方不堵,突然变的很堵,我们可以很及时的挖掘出来,背后有短时预测的技术才能做异常的监测。三是长时预测。对交管来说有警力分配的机制,会提前半个月或者一个星期做交警的警力分配,我们会做十天之内拥堵程度的分析和预测。
拥堵趋势变化:目前我们会把前六个月的数据拿出来,对整个城市道路交通的每个路段做拥堵情况变化趋势分析。这个路段在六个月之内车速变化的趋势分析,可以看到在六个月里面图上这个路段是恶化最因为的路段,背后一定有原因。比如说这块儿修路,或者这块儿经常出现频繁的交通事故,把这些信息关联起来就可以找到背后的原因。
我们会做拥堵趋势的总体情况分析,会把道路交通分类,在各个类别里面分析。通过BI的工具可以做到,但是为什么要做更高端的分析呢?我们要通过聚类的办法找出来变好和变坏的程度在哪儿,区别在哪儿,规划不能覆盖所有,只能找最迫切需要解决的问题。
拥堵模式的分析会对交通规划有很大的帮助。我们基于六个月的数据做模式分析,会挖掘出来五种拥堵模式,找其中一个给大家主要讲一下。这种模式在每天里面只要出现拥堵就是持续时间非常长,并且非常稳定的拥堵状态,跟整体道路的变化趋势基本一致,也就是说不堵的时候就不堵,一直都不堵,只要堵就会堵非常长的时间。结合前面说到的交通规划数据,交通运营管理数据,就可以挖掘出来非常多的信息。目前我们在这方面有跟多现实的结论,这样的话对于交管和交规,在出月报、年报的时候就会有一些结论,对于将来做后期的规划都会有非常有价值的帮助。
短时预测的方法是会对道路里面所有的路段,基于当前的时间点做推后30分钟的车速的平均预测。图上是某一个路段各种车速的情况,图上有4条线,最上面的那条线是基于历史情况分析;横线是拥堵的阈值,这个阈值不是固定的,会针对不同的路段有不同的标准,高速上我们认为20或者30就非常堵了,在很拥堵的小路里到10之下我们认为才是拥堵;蓝色的虚线是我们预测出来的,红色线是历史值。基于短时预测就有异常报警,异常报警的逻辑很简单,历史上认为这段时间不应该堵,现在非常堵,我们就要及时提出来,为什么不做实时的?因为有现实意义的需求,因为交警说如果有特殊的拥堵,不是拥堵了就马上去,因为有些拥堵十分、八分就过去了,有的时候是会堵很长时间,交警需要干涉的是现在已经开始拥堵了,并且趋势可能会堵的更多,所以就需要派警力干涉,但是不希望派的过程中拥堵消散了。满足条件了,我们才算作是拥堵。
长时预测是基于每天的拥堵时间做的预测,类似于天气预报。天气预报说明天有雨,并不一定是明天一天都下雨,也许是明天下雨的一个概率,我们的预测基本上是基于拥堵时长,明天或者后天,十天之内每天拥堵时长的预测,我们也会针对最关心的时段做拥堵时长的概率分布。比如说这条路上明天会堵2个多小时,我们关注的早高峰、晚高峰、午高峰会拥堵多长时间,这样的话对交管做下个星期或者下两个星期的警力部署会有非常大的帮助。
时间关系就讲到这里。谢谢大家!
陈清凝:随着大城市病越来越多,需要大数据这样的手段去不断地发现城市交通运行的规律和潜在的问题,我们也可以做一些预测。相比传统的交通手段,大数据为我们提供了非常新的切入口,让我们去分析这个行业。接下来我们有请首发集团博宇通达科技智慧交通大数据中心技术总监曹正凤先生上台为我们演讲。
曹正凤:尊敬的各位嘉宾,大家下午好!下面由我给大家做一个简单的分享。简单做一个自我介绍,我之前是做理论研究的,在高校做了15年的统计学教学,从2016年3月到首发集团,也就是北京博宇通达科技有限公司带领大数据团队做高速公路的大数据分析。我们想做的事儿是数据分析业内大家都向往的目标,就是具备计算机知识,再具备统计学知识,再加上业务领域的知识。这样的话我们就是数据分析领域的数据科学家,我正在朝这个目标努力。
我们所在的公司首发集团是北京高速公路运营管理方,北京有15条高速公路,13条都归首发建、管、养,说白了,大家每天进出北京都得交高速通行费,这些都是首发集团的业务范围。我们这个团队做的事情是基于每天200万辆车进出京的情况,路上每一公里摄像头的数据进行分析,找出一些为企业管理、为公众出行做一些数据探索的事情。
第一,大数据团队概况及建设方案
业内大数据团队一般的模式,我们跟IBM公司的大数据团队没法比,但是业内大部分互联网公司的团队基本上是这个状态。
我们团队的架构总前端是产品团队,产品团队做的事情是捕捉用户的需求,高速公路管理方有什么需求、市场有什么需求,由他来把需求提炼出来,交由平台团队、大数据团队,平台组要懂大数据技术这套知识。由平台团队到数据团队,数据团队也叫建模团队,建模团队做的事情是基于产品组提出的需求,基于现有的数据用我们的数理统计模型、数据挖掘模型、业务领域的模型把它基于数据构建出来,让它符合我们需要的某种业务需求。开发团队做的事情是把建模组做出来的模型用分布式的算法实现,包括前端BI展示。现在大数据业内做的最好的都是BI,大家都处在展示的阶段,大数据的业主方或者说甲方一般对细节不感兴趣,对底层的技术是怎么做的不感兴趣,只吸收看到一个很好看的界面,一个很好的大屏幕,所以现在业内BI做的特别好,也是我们开发团队要做的事情。QA团队是要做项目进展过程中的质量管理。
我们部门有19人,大部分是研究生以上,包括数据挖掘工程师、大数据可视化工程师、需求分析师、工总统工程师、架构师、业务经理、QA管理人。
第二,智慧交通大数据平台
我们是首发的子公司,我们做的事情是为首发服务,管理方有什么需求,我们要帮他实现。他们委托我们做的第一件事情是要求我们基于首发现有的数据做一个整体方案,整体的思路是“1+N”战略,“1”是指智慧交通大数据平台,这个平台要把高速公路上各种各样的数据收集起来。数据是什么样的?形容一下,比如你开一辆车到高速公路收费站的卡口,开过来首先触发的是线圈,一触发知道有一辆车来了,在你的左前方有一个摄像头会抓取你的车牌号,线圈触发就会形成记录,加上抓取的车牌号,这就是一个信息源,车的前面会有拍照,会板全景拍下来,这是第三个感应器。第四个感应器是在上面有一个类似于录像机,会从你触发线圈到你离开的过程会录下来,四个感应器,数据就源源不断地进入到我们的系统里面,我们的平台就要处理这些数据,有结构化、非结构化、有视频、有图像。
这些工作都是基于云平台,基于云平台虚拟化的数据,我们大数据平台部署在这个云平台的基础上,虚拟化的目的是我们进行业务运维的时候方便一点。大数据基础平台进行数据采集的事情,智慧交通大数据平台做的是结合过速公路领域的需求,做一些行业内的数据采集,数据清洗。再往上做具体的应用,要解决实际问题,比如说我们解决的第一个问题就是逃费稽查。首发集团每年会有几千万的逃费金额,有各种各样的人会想办法不交高速公路费。比如说广东2亿的逃费,武警恨不得都上高速把钱要回来。
智慧交通大数据平台我们用的是Hadoop技术,我们把大数据从DOS时代升级为Windows时代,原因是后续的开发成本、运维成本会下降。
一期建设做的事情是把智慧交通大数据平台搭建出来,并且开发出来。底层是Hadoop技术,就是现在比较流行的大数据技术。再进行综合稽查系统,再进行BI展示,这是做数据分析第一件事情,展示的特别漂亮,领导说你做二期吧。第三个是视频结构化。
智慧交通大数据平台一开始的想法是团队在做这件事情的时候发现很麻烦,我要学习各种各样的知识,各种技术都得会。我们发现这些技术很麻烦,平台组的人掌握起来很轻松,但是到了建模组的人就很麻烦了,还得折腾dos的东西,所以我们想降低门槛,差不多有点儿统计学知识的人就可以进行交通大数据分析,再往下就是人人都可以做大数据分析,这是一个愿景。
原因是大数据学习过程的门槛很高,比如说我们要学JAVA、sprak、mahout技术等等,学起来很麻烦。开发难度也比较高,我们在论坛给学员讲课的时候就用的是Hadoop2.0系列,这里进行求派值的实验,用的是Hadoop自己的那套技术,做的时候大家发现必须要歇一歇dos命令,这个过程很麻烦,开发难度很高。Hadoop的运维成本也比较高,要真正部署到我们集团去的话,我们集团必须要有对大数据特了解的人,后来集团认为这件事情咱们能不能省一省。我们想,还是开发一个平台,后续运维的时候只需要一个人就可以了,工作量会降低。
基于学习难度高,开发难度高,运维成本高,我们做了智慧交通大数据平台。这个平台主要做的事情是要把数据进行全方位的汇集,这是最基本的。将来大家不是在首发做,可能在另外一个行业做大数据,也可以有这样的思维,肯定也要汇集数据,肯定不能再用传统的Oracle数据库,因为图片怎么存储都不或解决,所以用大数据平台这个问题相对好解决一点。我们开发了一个Windows的Hadoop,这个平台的特征是拖拽式,我把组件开发出来,比如说你要做一个数据表的描述性统计,要进行百分位数、平均值,各种统计图的计算,只要是拖拽式就可以实现。这样的话,使得建模组的同志相对来说比较轻松。拖拽式就可以实现某一个分析的事情。
功能性可以进行自动的一键式部署,任务监控等等。安全性方面,如果大家为某个行业做大数据的话,安全也很重要,国内暂时没有很多的人提大数据安全的事情。我们说的大数据安全是技术层面,隐私保护是另外一件事情。我说的安全是数据泄露、黑客攻击的事情,要进行授权。
简单说,我们把使得大数据的开发运维成本降低,使得技术门槛降低,我们就做了这么一件事情。
第三,智慧交通大数据应用
一是综合稽查;二是BI展示,三是视频结构化。
首先是综合稽查。每天都有人想办法不交高速公路通行费,我们可以通过采集监控数据,采集收费路网数据进行车牌比对、图像识别。在系统里要进行嫌疑车追逃规则的梳理,第一种规则分析某辆车在什么时间进的,什么时间出的,从哪儿到哪儿,什么时间。是不是在合理的时间,合适的空间上在高速公路上行走,如果是在一个不合适的时间,不合适的空间行走的话,他可能就有问题。一期我们使用的是车牌比对+特征比对。这个车如果没有车牌,就要看车上的挂饰。这是规则。
规则做好以后就要放到大数据平台上,我们会进行异车倒卡的大数据处理流程。这个流程放到我们的平台软件上,一点运行就会把全路网的数据筛一遍找出我所要的嫌疑车辆。平台做的这件事情使得工作处理起来比较顺畅。异车倒卡是什么情况?看一下北京市路网,有收费站,有一辆车,这是2016年9月份的数据。这辆车从百泉庄进来,从京沈土桥收费站出去,同时跟他对相行驶的车,从土桥进,从百泉庄出,这两辆车是一个公司的,只有一个公司才会有这么明确的信息。你从这儿过来,我从哪儿过去,中间异车倒卡。在中间的时候他们俩把通行券进行了交换,改换以后从百泉庄向土桥的车拿着另外一辆车的通行券。这样的话就可以实现逃费。
应该交125+145,实际上就交了20+10,逃费240元。
同车倒卡处理流程。同车是自己逃费,一个车有进的记录,没有出的记录,可能从最近的一个地方出了,他手里有一张通行券。
综合稽查解决了业务系统的痛点,将来大家无论做什么样的行业,你要解决的是真正需要解决问题,否则的话会觉得你做的东西没有用处。2016年3月我进入首发以后,刚开始我提出了各种美好的愿景,各种各样的想法。我们进某一个行业要先考虑好你对这个行业是不是真的了解,某些会是一个很痛苦的过程。后来我提出了解决方案,我不预测常规性拥堵,因为这是都知道,我预测非常规性拥堵。
我们正在做基于深度学习从图片上提取某个车辆的特征,比如说车辆的颜色、车辆的型号,这叫车辆多围特征提取。交通参数提取,因为在高速公路上还有一些交通参数感应器,这个感应器2公里一个,是雷达的形式,是扫断面,这个断面上有多少辆车,车的速度是多少,车的密度是多少,把这些交通参数提取出来,要通过视频提取。交通事件,比如说有没有倒车,有没有移洒,移洒的事情经常发生,追责要追前面车辆的责任,谁扔了这个东西。这个时候需要通过视频,视频要自动分析出来有移洒。之前是每天巡逻车在路上巡逻,有40多辆车,如果视频革命他这个地方有移洒,如果有提前预警的话就更好,那个车就在那儿待着,很快到达出事地点,很快把掉下来的东西移走,就不会有人撞了。所有的这些分析都是要给予业务应用,这一点我在反复提。
基于大数据平台的实时BI展示,这是第三个应用。这是一个KPI指标,今年能不能完成任务,能不能把集团收费的情况完成的展示。
按车型同级车流量,我们做的事情是按车型汇总交通流量,每天凌晨2点使用Sqoop组件抽取到Hadoop平台上,为什么是2点钟?一个是有延时,第二个也不会惊动业务系统。启动spark任务进行统计计算,并将结果写入到MySQL,按车型统计每小时的交通流量和收费数据,按车型统计每天交通流量。
这是我跟大家分享的内容,有些是我们的业务内容。
陈清凝:感谢曹总的分享,干货特别多,信息量非常大,让我们看到了交通行业在用大数据手段提高行业管理效率的实践,让我们感受到了城市交通在管理方面所进行的努力。接下来让我们有请上海得拓信息技术股份有限公司总裁助力梅彩先生上台。
梅彩:大家下午好!
我叫梅彩,来自上海德拓。我之前做软件19年,做过云计算、IT管理,做跟数据相关有10年,交通也做过一些。今天我演讲的题目是“大数据——提升交通管理水平、构建智慧交通系统。”
德拓总部在上海,成立于2011年,现在有三大类产品,第一类是存储产品,我们在高带宽的视频行业,比如说在电视台的占有率非常高。第二类产品是做超融合,就是基础架构云、基础架构平台私有云。第三类是跟大数据相关的产品,我们有一个集成平台。目前我们的大数据产品到7月份刚刚发布了3.5版本,今年1月份是3.1,7月份发布了3.5版本,进度比较快。德拓成立以来销售收入每年翻番,今年二季度数据还没出来,一季度仍然是翻番的。成立以来,除了第一年以外,以后每年都是赢利的,我们的目标是成为上市公司。
我们专注在跟数据相关的领域,我们提供的是融合解决方案。我们总部在上海,在南京、成都有研发机构,在上海也有研发中心,今年会在北京成立人工智能实验室,也会在西雅图成立数据安全实验室,全国其他地方有很多销售和服务机构。
今天会议的主题跟数据相关,在座的大部分都是数据分析师,是这个领域的专家,我们讲一下跟数据相关的内容。德拓在交通领域做过交管,也就是交通管理局。我们也做过道路运输管理局,交警大家很熟悉,发车牌、发驾照都是交警管理的事情。运管是做出租车的管理,客车的管理,货车的管理,危险运输的管理,驾校的培训也是在运管。交委我们也做过一些项目,帮助交委提高管理水平。另外,我们做过大数据的孵化器。孵化器是什么意思?就是把交通行业的一些数据开放出来,开放给第三方开发者使用,第三方开发者可以是个人创业者,也可以是新成立的公司或者是其他公司,都可以,我们也做过类似的案例。
我们做的几个项目在整个交通领域,不管是交警还是交委反响都比较好。比如说贵阳交管的项目,克强总理亲自去看过,克强总理看完以后说“做的比较好,人在干,云在算。”陈刚书记补充说“天在看”,意思是说人干、云在算,另外还有摄像头监控交警的行为,交警有执法记录仪在记录一些东西。交警的手机都会有定位的位置,会记录执法的时候具体位置在什么地方,每天工作的时间,在哪些地方执法,行动轨迹是什么,这是指天在看。贵阳交管是数据铁笼项目,什么意思?贵阳的大数据项目做的很成功,全国的数据大数据博览会是在贵阳召开,在贵阳交管是第一批做的,做的最成功,所以才会受到这么大的重视。习总书记说“要把权力关在制度的笼子里。”用大数据的手段对交警的权力和行政执法进行很好的监督,以前是靠人管理,靠人监督,现在上了大数据系统以后把管理监督决策都变成了由数据来执行。我们看到了大数据很多高速公路逃费的问题,这里是大数据对权力的制约,提升了交警的管理水平。
具体看一下该交警是怎么做的。交管的业务比较大,在公安体系里面是非常大的警种,有20几个业务系统,我们把20几个业务系统的数据融合到一起,采集汇集到大数据平台,里面有结构化的数据和非结构化的数据,把互联网的数据,比如说跟贵阳相关的微信、微博、论坛、报纸、媒体的数据采集上来进行分析。融合以后首先会给交警建一个个人的诚信档案,你可以理解为对交警360的画像。二是可以看到社会舆论对交警管理水平的评价。三是我们利用大数据来改进交警的业务,提升他的服务水平。四是会出一些分析模块,可以给领导用的模块。
来源:CDA数据分析师峰会:大数据与交通旅游-分会场


雷达卡



阅读权限+下载200次/日+产品折扣+免费数据库+免费广告+人才库+海量论坛币
阅读权限+下载40次/日+产品折扣+免费数据库+海量论坛币
京公网安备 11010802022788号







