Greenplum-全球领先的开源大数据平台

Greenplum 是全球领先的开源大数据平台。

Greenplum 大数据平台基于MPP(大规模并行处理)架构,具有良好的弹性和线性扩展能力,内置并行存储、并行通讯、并行计算和优化技术,兼容 SQL 标准,具备强大、高效、安全的PB级结构化、半结构化和非结构化数据存储、处理和实时分析能力,同时支持涵盖OLTP型业务的混合负载,为客户打通业务-数据-洞见-业务的闭环,可部署于企业裸机、容器、私有云和公有云中,支撑着全球金融、证券、电信、政府、制造、交通运输等各行业的大量核心生产系统。

architecture

Greenplum 大数据平台为全球各行各业提供具备实时处理、弹性扩容、弹性计算、混合负载、云原生和集成数据分析能力的强大的大数据引擎,目前广泛的应用于包括金融、保险、证券、通信、航空、物流、零售、媒体、政府、医疗、制造、能源等行业。

Greenplum 大数据平台的优势

  • 一次打包到处运行的平台:不管是裸机、私有云还是公有云。不受限于硬件环境和平台,用户可以灵活的选择最适合自己的方案,迁移代价低。硬件环境的普适性,提供了极大的灵活性,解放了硬件平台的制约和绑定,为客户解决了后顾之忧。使用 Greenplum 可以在其间无缝迁移,开发、运维人员不需要学习新的数据库处理技术。
  • 处理和分析各种数据源的数据的平台:支持各种数据源,包括 Hadoop、HIVE、HBase、S3、Gemfire、各种数据库和文件等,不需要移动数据,避免了数据加载的复杂性,和其带来的数据不一致的问题。
  • 支持各种数据格式的平台:不管是结构化、半结构化(XML、JSON、KV)还是非结构化,譬如文本数据、GIS数据、图数据等。
  • 具有强大内核的平台:Greenplum 具有强大的内核技术,包括数据水平分布、并行查询执行、专业优化器、线性扩展能力、多态存储、资源管理、高可用、高速数据加载等。
  • 具备强大灵活性和可扩展性的平台: 支持扩展(Extension)、自定义类型和函数、PXF和外部表技术。可以使用多种语言实现用户自定义函数和聚集,包括 PL/Python、PL/R、PL/Java、PL/Perl、PL/PGSQL 和 C 等。
  • 支持标准的平台:支持SQL、JDBC和ODBC等行业标准。经过半个多世纪的发展,SQL 成为了数据平台的万向头,向上可以连接各种 BI工具、可视化工具和数据分析工具,向下可以连接各种ETL工具、各种数据源和各种格式的数据等。
  • 集成数据分析平台:支持商业智能(BI)、文本、GIS、图、图像、流式数据处理等。通过Pivotal开源的 Apache 顶级项目 MADlib,Greenplum 可以在数据内部运行 50 多种数据分析和机器学习算法。MADlib 提供 SQL 接口进行数据分析,大大降低了数据分析的门槛;MADlib 内建于数据库内,使用 MPP 的优势,提高了分析的效率;MADlib可以在全量数据而不是抽样数据上进行分析,提高了精度。
  • 开放源代码且持续大力投入的平台: 2017年 Pivotal 在 github 的开源贡献列表中全球排名第四左右。 采用开源方案,不担心后门问题和被锁定问题。开源还可以构建更好的生态。
  • 采用敏捷软件开发方法开发的平台:Greenplum 采用敏捷方法开发,实现了快速迭代、持续发布和质量内建。2017年 Greenplum 发布了10个版本,以前发布一个版本需要1个月左右,现在只需要十几个小时。
  • 具备企业级稳定性的平台:Greenplum 经过十多年发展,有大量活跃客户,大量数百节点集群为全球2000强企业生产系统提供服务,稳定性非常高。
  • 具备成熟生态系统的平台:Greenplum 生态非常完善,有大量的合作伙伴。

发展历程

2003年,Greenplum 公司成立于2003年。

2008年,发布Greenplum数据库产品。

2010年,Greenplum被高端存储领域巨头EMC收购,同年Greenplum借助EMC中国卓越研发集团进入中国,并创建Greenplum中国研发团队。

2014年,Greenplum从EMC独立出来创立 Pivotal,并获得通用电气、福特汽车和微软的投资。

2018年,Pivotal在纽约证券交易所上市,目前市值60多亿美元。

开源社区和生态

Greenplum 基于世界上最先进的开源数据库PostgreSQL。

2015年10月Pivotal正式把投资超过10年的Greenplum开源,采用 Apache 2 协议,成为世界上第一款成熟的开源 MPP 数据库。开源之后,Greenplum 社区发展活跃,短短2年左右,在全球有上百来自美国、中国、俄罗斯、日本、英国、德国、芬兰、瑞士等国家的贡献者,获得社会各界的广泛关注。其中Greenplum中文社区尤为活跃,目前约有半数的贡献来自中国开发者,社区贡献者包括阿里云、中移动等大公司,也有诸多中小公司和数据库爱好者。

Greenplum把敏捷软件开发方法学引入到分布式数据库的开发中,通过使用站立会议、回顾会议、结对编程、持续集成、测试驱动、单周迭代等敏捷方法建立了高效的快速反馈系统,大大提高了产品的质量和客户的满意度。Greenplum 5.0 是开源之后发布的第一个稳定版本,大约保持1个半月一个版本的发布速度。Greenplum 主干分支(master)开发非常活跃,众多社区期待的特性稳健推进中,包括内核升级、新课题,处于业界领先地位。

Greenplum 社区定期举办各种技术研讨会、技术沙龙、101培训等活动,获得良好反馈。华东师范大学等知名大学开设了Greenplum相关数据库课程,并在学术领域取得了突出成就。

Greenplum 生态完善。得益于对SQL标准的出色支持,Greenplum可以与上下游的各种产品实现集成,包括 PgAdmin、Informatica、Cognos、SAS、Talend、Qlik、Tableau、Anaconda、Microstrategy、Boundless、Zattset、Datometry 等,涵盖ETL、商业智能、高级分析、可视化、集成分析、GIS数据处理、迁移、安全和管理等各个领域。

© 2019 Copyright By Greenplum.cn. All Rights Reserved.