HP公司Haven架构开发出的Vertica平台
分析数据库管理系统:HPVertica分析平台第7版
内存数据库管理系统:Vertica并不是一个内存数据库,但由于拥有高(磁盘)读取率,所以它声称能确保接近实时的查询能力
Hadoop分布式系统:无
流处理技术:无
硬件/软件系统:HP融合系统(ConvergedSystem)300,专为Vertica设计,以及一个适用于Cloudera、Hortonworks和MapRHadoop分布式系统的参考架构选择
HP将它的大数据平台架构称之为Haven,是Hadoop、Autonomy、Vertica、企业安全 (EnterpriseSecurity)和"n"应用的首字母缩写。HP没有自己的Hadoop分布式系统,但它为领先的Hadoop软件分发商提供参 考的硬件设置。Autonomy的IDOL软件从事着非结构化数据的搜索和获取工作,而Vertica则是HP公司大量并发数据处理的分析数据库管理系 统,专为大量结构化数据集的快速分析而设计。与IBMPureData分析系统(Netezza)和PivotalGreenplum这样类似的产品相 比,Vertica倾向于补足而不是代替类似Teradata这样的传统企业数据仓库环境。
随着Vertica7的发布,HP增加了一个"FlexZone"设计,使得用户在制作数据库方案和相关分析、报告之前,可以在大量数据集里获取有 用数据。第7版还通过Hive的HCatalog元数据存储库与Hadoop实现了整合,为用户提供了一个在HDFS上以表格浏览的形式获取数据的途径。
HP公司用于收集和分析机器数据的ArcSightLogger软件及其操作分析(OperationalAnalytics)工具,使得它比大多 数竞争对手更像是大数据分析上的一个IT螺旋。比如,IBM、SAP和Oracle在数据整合、商业智能和企业应用的分析软件方面就更加深入。如果您选择 HP作为IT系统管理和硬件供应商,那么Haven平台及其组件可以作为Hadoop和第三方数据管理及分析软件的投入补充。
Hortonworks对开源之路的追求
分析数据库管理系统:HBase,虽然不是一个数据库管理系统,Hive仍然是Hortonworks提供的在Hadoop顶层实现SQL查询的不错选择
内存数据库管理系统:虽然不是一个数据库管理系统,ApacheSpark仍然支持在Hadoop顶层进行内存分析
Hadoop分布式系统:Hortonworks数据平台(HDP)2.0,HDPforWindows,HortonworksSandbox(提供Hadoop教程的免费、单节点桌面软件)
流处理技术:Hadoop上的开源流处理技术选项,包括Storm硬件/软件系统:合作伙伴工具和预配置的硬件,或都可从HP、Teradata和其它平台上获得
Hortonworks是开源Hadoop社区的大量贡献者,致力于将它建成一个具有广泛能力的数据管理平台。由于避开了专有组 件,Hortonworks将它自己与竞争对手Cloudera和MapR区别开。与开源软件一样,Hortonworks数据平台(HDP)上的所有东 西都可以免费获得。
对于它的批评者(前述的竞争对手)来说,Hortonworks把这个开源策略推到了过分的地步,传送广受欢迎、获得社区认可的开源功能,而放弃不 完全开源的新功能(有可能在技术上是更好的功能)。比如,Hortonworks一直坚持做并且试图完善Hive这个开源系统,与此相 比,Cloudera则承诺基于Impala来实现性能更佳的Hadoop上SQL功能,而Impala虽然在技术上是开源的,但需要用专有的 Cloudera管理软件才能达到最佳的管理效果。
简单地说,HDP是一个保守的Hadoop分布式系统。据报道,Hortonworks在技术支持成本上占有对竞争对手的优势。 Hortonworks秉持这样的做法:没有任何来自供应商的威胁可以占据它的分布式系统,并且它传送的任何东西都得到完全彻底地测试和验证。你不必感到 惊奇,但一旦享受了Hortonworks提供的服务,你就不会想从社区的其它地方获得任何产品性能、简易管理或功能实现方面的东西了。