你好,欢迎来到经管之家 [登录] [注册]

设为首页 | 经管之家首页 | 收藏本站

打造互联网时代的数据仓库和云平台_电子信息工程毕业论文

发布时间:2015-03-16 来源:人大经济论坛
打造互联网时代的数据仓库和云平台_电子信息工程毕业论文 随着企业数据的成几何指数增加,数据存储、管理和在线分析能力要求越来越高。尤其是面对激烈的市场上,企业只有更好的使用数据才能面对更好的竞争。构建新一代的数据仓库平台和云平台就成了企业的最佳选择,也是数据库厂商的新机会。 近日,GreenPlum公司推出了最新的GreenPlum Database 4.0数据库和首个商用企业数据库云端运算平台GreenPlum Chorus。GreenPlum的数据库仓库产品采用了MPP(Massively Parallel Processing)并行处理的架构,数据库引擎是基于软件的引擎,不依赖一些专有硬件平台,同各种硬件和操作系统平台有很强的兼容性,可以很轻易地使用10G的以太网络,SSD存储还有虚拟化技术来服务于数据分析。同时具有很强的伸缩性,支持从几个TB的数据到几个PB(1PB=1000TB)的数据,Greenplunm的联合创始人兼首席技术官Luke Lonergan说,GreenPlum的客户eBay,拥有世界上最大的数据库,目前在100个服务器上的运行6个PB的数据量。 MPP中所使用的MapReduce是一种新的处理技术或者说是一种新的处理的框架,是谷歌发明的一种主要用于文本的分析检索功能,使用这种技术,只需要增加节点就可以线性的提高系统的存储容量和处理能力。Luke Lonergan说,为了充分发挥MapReduce这种特性,在GreenPlum数据库系统中提供相应的API可供不同的编程语言调用;由于具有硬件平台的无关性,这样可以很强的伸缩性,并能有效节省成本。 除此之外,在工作负载管理、自我恢复容错和数据分析有了更大的突破。工作负载管理就是既要保证工作负载的全部完成,又要保证处理的优先级。Luke Lonergan说,工作负载管理利用资源队列管理实现按用户组的进行资源分配,比如:保证公司的高层管理人员早晨一到办公室就能够拿到数据,同时保证其他被分配的任务全部顺利完成,而且还有防止低质量的SQL对系统资源消耗的管理。 对于容错和自我恢复,实现了同谷歌的容错系统相似的功能,利用服务器之间的容错镜像备份,拥有完整的自愈功能,也就是说当一个服务器失灵或坏掉了,其他的备份服务器可以跟上来继续做读写的功能。当这个失灵的服务器恢复之后,因为所有的系统都是在线的,它可以再自己赶上来,这样就不会有数据丢失,使管理时间尽量缩短。 在数据分析方面,增加了更快的单行操作(选取、更新、插入和删除)等的优化,加强了深度分析功能,引入新的分析方法。更为突出的是,是对在混合工作环境下的服务级别协议和请求的优化,Luke Lonergan说,当前越来越多的客户在做数据分析处理的同时,也在做在线交易的处理,即OLTP(在线事务处理)和OLAP(在线分析处理)同时进行,GreenPlum数据库能够进行不同的分类和重新导向以便有效的加速交易处理的速度。 对于云端数据库平台Chorus,Luke Lonergan说,Chorus是第一个具有数据库能力虚拟化的云平台,企业用户通过GreenPlum的数据库和Chorus,建设强大的企业级的数据云系统。Chorus主要包括了三个主要的功能,自助服务供应、数据库实例(DataBase Instance)、数据集市管理。
经管之家“学道会”小程序
  • 扫码加入“考研学习笔记群”
推荐阅读
经济学相关文章
标签云
经管之家精彩文章推荐