大数据应用领域有哪些 中国数据库有哪些( 三 )


总的来说,得益于浪潮的硬件优势,在硬件方面的工作 ZNBase 团队做起来还是比较顺利的,这也是浪潮 ZNBase 相对于其他分布式数据库来说的一个优势 。

大数据应用领域有哪些 中国数据库有哪些


与 TiDB 等分布式数据库的区别提到 HTAP 分布式数据库,我们不得不提近年来在社区中人气火爆的明星项目 TiDB,以及一些同样主打 HTAP 场景融合特性的数据库产品,比如国外的 Greenplum 、阿里云的 HybridDB for MySQL、百度的 BaikalDB 等 。陈磊认为,与这些数据库相比,ZNBase 的优势主要体现在两个方面 。
第一是背景不同,其他的产品都是大的互联网公司开发的或面向互联网应用的 。浪潮是大型 IT 企业面向政府大数据、大型企业应用而产生的 。
第二是架构或技术栈有所区别 。虽然大部分分布式数据库采用 KV 存储,但刚谈到 ZNBase 是 ShareNothing 架构的,TiDB 则是共享存储架构 。由此,浪潮 ZNBase 的优势是扩展性更好,部署运维更加容易,为用户提供了可直接启动的二进制包;另外基于浪潮所服务的一些客户的使用习惯,ZNBase 会兼容更多的 Oracle、DB2 等传统商业数据库的函数与语法 。
在硬件方面,浪潮的技术团队在国产芯片及操作系统兼容和优化方面做的更多些 。浪潮有自己的分布式存储、操作系统、云平台研发团队,做了很多底层适配与底层优化的工作,这使得 ZNBase 更加稳定可靠 。
详细来说,ZNBase 与同样基于 Spanner+F1 设计理念的 TiDB 在 HTAP 架构上还是比较类似的,就是都会提供一个列存的副本,主打的是 OLTP 使用场景,OLAP 的场景应用性能偏轻量级,同时在不断地增强中 。二者的主要区别在于面向的客户群体不同 。ZNBase 根据浪潮长期积累的大量政府、金融和传统企业客户的需求,对 Oracle、DB2 等传统商用数据库做了大量的兼容性工作,这对浪潮的客户迁移到 ZNBase 很有帮助;而 TiDB 可能更多是面向互联网行业的客户,更多地兼容 MySQL 的生态 。
而国外比较火的 Greenplum 是主打 OLAP 场景的产品,OLTP 方面在不断增强;HybridDB for MySQL 和 BaikalDB 这两款产品实际上与 Greenplum 类似,他们都是有一个独立的列存引擎,也就是在表建立之前就已经定义了是列存表还是行存表 。而 ZNBase 和 TiDB 都是既有行存的数据副本,也有列存的数据副本,这个实际上是一个本质的区别 。
“所以说目前主流的 HTAP 分布式数据库采用行存和列存副本,对同一份数据采用不同的存储格式,应该是未来的一个方向 。”陈磊表示,“不过目前我们暂时没有能提供的具体对比数据,各位技术爱好者如果有兴趣就可以自己拿来进行对比,也可以为我们分享 。”
HTAP 大有可为关于近年来兴起的 HTAP 概念,陈磊结合浪潮客户对数据库产品需求的变迁历史,为我们描述了分布式数据库从 OLTP 场景需求到与 OLAP 场景需求结合的进化过程 。
从浪潮一直以来接触的一些客户使用场景来看,目前的传统企业市场需求主要还是以 OLTP 为主 。主要体现在这些客户的业务量规模扩大了以后,比如说他们需要增加 10 台服务器,可能同时要维护一个包含上百亿数据量的表,这个时候数据还需要不断往里加 。这种场景就是分布式数据库的 OLTP 部分可以满足他们的需求 。
在解决 OLTP 需求的基础上,整个数据库系统必然会有一些数据的沉淀,人们就需要从这些数据中挖掘出对自身业务有意义的价值,这就产生了对这些数据进行分析的需求 。而分布式数据库承载的数据量通常要比传统数据库大得多,用传统技术进行数据分析就会很痛苦,可能一个查询操作就要等上好几天的时间,甚至无法返回结果 。“这就是我们还要在解决 OLTP 的基础上增加 OLAP 功能,做成一个融合二者的 HTAP 数据库的原因 。”

推荐阅读