信通院讯:开源Greenplum给分布式数据库带来新的生机

2019年6月,由中国信息通信研究院(信通院)、中国通信标准化协会主办的2019大数据产业峰会在北京国际会议中心隆重举办。在该会议上,来自中国信通院云计算与大数据研究所工程师王卓为我们带来了第八批大数据产品能力评测的精彩解读。内容详见原文

一、报告亮点

1. 开源Greenplum给分布式数据库带来新的生机

自2015年Greenplum数据库开源以来,整个分析型数据库发展明显加快,部分原因是Greenplum的开源让更多厂商能使用和研究分布式分析数据库。据统计参与评测的14款MPP数据库中43%都是基于Greenplum数据库,Greenplum的开源给了广大数据库厂家了解学习和构建自身分析型数据库一个明显的契机。分布式分析数据库正在努力突破扩展性的限制,大规模能力有很大突破。

2 .分布式事务数据库产品迎来春天

分布式事务数据库基础能力是在不断提升的,两批测评之间产品能力和水平都有了相应的提升。在架构方面,82%的产品是采用中间架构,18%的产品使用新型一致性协议。新型产品基于MySQL是最多的,现在基于PG的厂商正在兴起。

二、Greenplum数据平台开源史

  • 2005年 Greenplum公司成立,发布了Greenplum数据库
  • 2010年 EMC收购Greenplum公司
  • 2014年 EMC和VMWare合资成立Pivotal公司,Greenplum归入Pivotal旗下
  • 2015年 Pivotal将Greenplum数据平台使用友好的Apache License V2.0开源
  • 2017年 Greenplum开源后第一个大版本v5.0发布
  • 2019年 Greenplum开源后第二个大版本v6.0即将发布。6.0的新功能详见 《历经两载磨砺,Greenplum进入6.0时代》

三、Greenplum数据平台简介

Greenplum 是全球领先的开源大数据平台。

自从Greenplum进入中国以来,深受客户好评,广泛应用于铁路、通信运营商、银行等行业,在服务客户的过程中,产品不断迭代,性能突出系统稳定。Greenplum秉承了PostgreSQL在分析场景下的优势,前瞻性地增加了分区表、列存储、压缩等特点,广泛应用于企业级数据仓库、决策支持、数据实时分析等场景。

Greenplum从开源的早期版本开始迭代,经历了5.x的20几个版本更新,目前已经来到了6.0版本,底层PostgreSQL内核从8.3版本迭代到了9.4版本,性能越来越强劲,正在朝着一款分布式HTAP数据库发展。相信随着PostgreSQL内核合并的加快,越来越多的新特性会被发掘出来,Greenplum未来必将成为分布式分析型数据库领域中的一款标杆产品。

详细了解Greenplum开源数据平台,详见《Greenplum-全球领先的开源大数据平台》。