数据库的发展——
一图让你秒懂中国数据库的40年江湖
传统数据库一定要基于外置存储,而新型的分布式数据库是基于PC服务器,再加上内置盘,不能使用高端存储。
新型分布式数据库有两大分支,一个分支是NoSQL,一个分支是NewSQL。两者的目标一致,都是为企业提供好的数据库管理软件,只是方式不一样,前者是从底向上的设计,后者是从顶向下的设计。
NoSQL会先把底层的存储、通讯都搭好,然后是计算。NewSQL的做法是基于已有的关系型数据库的框架去修改存储,然后满足分布式的需要。
点击进入『21世纪大数据人才汇聚领域』
点击进入『21世纪大数据高薪就业领地』
去年底,美国做了一个研究,结论是未来NewSQL会与NoSQL合并,越来越多的NewSQL开始支持NoSQL, 而NoSQL也会向NewSQL靠拢。我们认为五年之内NoSQL和NewSQL可能会成为历史名词,大家会认为是新一代的分布式数据库,具体是NoSQL还是NewSQL,每个厂商可能都会有自己API特性和SQL特性。
从整个大数据基础软件的发展来看,未来会殊途同归,会从传统的关系型数据产生分支,通过操作系统方式进行。其实所谓的文件系统加分布式调度就是Hadoop,Hadoop自己不做上层建筑,核心是分布式调度和分布式操作系统,数据库在这个层面走的方向就是MPP数据库,第三个是重建分布式架构,专注于存储引擎的建议。三者目标都是为了企业做成熟的管理软件,未来都会统一,将会变成分布式数据管理系统。
很多人问,分布式数据库的未来将会是什么样的?会不会消亡?我认为十年内不会,至少与IBM的主机一样,在很多全球500强企业里还会再用,比如说DB2,现在很多银行还再用它。关系型的数据库的Oracle不会死亡,会成为存量市场,但会逐渐萎缩。
新型数据库的NoSQL和NewSQL,两者会在接下来短短几年时间内产生较大融合,SQL和Hadoop会成为另一个分支,主要是做分析为主,分布式数据库将会是更加通用化的场景,包括OLTP和一些分布式的事务、高性能的读取、高并发都是数据库支持的。SQL—on—Hadoop将会局限在低并发企业内部的分析。