北京站 |《Greenplum:从大数据战略到实现》读者技术沙龙 第三场

活动介绍

全球首个开源大数据平台Greenplum官方技术教程、《数字化三部曲》之二--《Greenplum:从大数据战略到实现》纸质版将于8月火热发售。这部以全媒体思维打造的技术著作,凝聚了Greenplum研发团队的创新智慧。为了给技术研发者、用户、学习者提供更多元化的学习形式和更紧密的交互渠道,作者团队将携Pivotal中国研发中心BAT专家CMU(美国卡内基梅隆大学)校友会机械工业出版社给大家带来6场关于“大数据战略与实现”的读者技术沙龙。

第三场活动将为大家带来数据库容器化分布式数据库上云的实战经验和心得(Greenplum for Kubernetes),分享如何从查询计划入手优化数据库并找到问题所在。HVR技术总监为大家带来了《异构数据库到数仓实时同步方案》,现场讲解分析Greenplum的应用案例,还有中信证券的技术大牛告诉你《证券行业如何用Greenplum玩转大数据》,介绍Greenplum在证券行业的实际应用。

除了诚意满满的技术干货分享,我们还为大家准备了各种福利

  • 现场踊跃提问者将有机会免费获得由作者亲笔签名的《Greenplum:从大数据战略到实现》一本;
  • 现场将抽取幸运参会人员赠送Greenplum定制专属纪念品;
  • 现场认真填写反馈表将有机会获得华章电子书金卡一张;

门票信息:

线上票:10元(仅限线上观看使用,观看链接将于活动前40分钟以短信方式发送至手机)
早鸟票:
25元(8月12日18点前可购买);
普通票:50元(将赠送价值80元的Greenplum中文社区官方T恤一件)
尊享票:90元(将赠送原价为119的作者签名的《Greenplum:从大数据战略到实现》纸质书一本)

地点:Pivotal北京办公室(海淀区科学院南路2号融科资讯中心B座12层)

时间:2019年8月16日 下午1:00 p.m.- 5:00 p.m.

请扫描下方二维码进行活动报名:

活动议程

13:00 – 13:30:签到

13:30 – 13:45:开场致辞

姚延栋,纽交所上市企业 Pivotal 公司全球研发总监
彭晓强,阿里云数据库事业部资深技术专家,阿里云 AnalyticDB for PostgreSQL 产品技术负责人

13:45 – 14:30:从查询计划入手优化数据库

郭峰,Pivotal中国研发中心 资深软件工程师

14:30 -15:15:异构数据库到数仓实时同步方案

顾全,HVR中国技术总监

15:15 -15:30:茶歇与自由讨论

15:30 -16:15:证券行业如何用Greenplum玩转大数据 

岳丰,中信证券信息技术中心数据平台总监

16:15 – 17:00:数据库上云最佳选择——Greenplum+Kubernetes

翁岩青,Pivotal中国研发中心 高级技术经理

主题介绍

主题一:从查询计划入手优化数据库

分布式数据库作为一个庞大的系统,运行在复杂的硬件环境上,同时受到稳定性和性能的考验,对分布式数据库调优,总是让DBA既兴奋又头疼。来自Pivotal的Greenplum核心开发工程师将从EXPLAIN讲起,教你如何读懂并理解分布式查询计划,并分享怎样通过查询计划找到问题。

演讲大纲:

1. Greenplum查询处理过程

2. Greenplum查询计划解读

3. Greenplum查询调优

主题二:异构数据库到数仓实时同步方案

伴随着大数据技术的兴起和发展,数据湖的概念也越来越热。数据湖的概念指出,数据无需加工整合,可直接堆积在大数据平台上,由最终使用者按照自己的需要进行数据处理。这与传统的企业数据仓库则强调的是整合、面向主题、分层次等思路完全不同。但一个共同的趋势是,T+1的数据分析模式越来越难以满足业务的需求, 实时性成为业界共同关心的话题。 Greenplum创新的MPP架构使得数据分析速度得到革命性的提升, 相对的,数据实时地从各种异构数据库平台集成到大数据/数据湖就成为实时分析面临的挑战。

演讲大纲:

1.对数据湖的理解和定义(Greenplum是其中一种)

2. 大数据实时集成方案应该具备的功能和特点

a) CDC的复制技术

b) All-in-ONE Box的解决方案(初始化同步,增量同步,数据比较和监控)

c) 软删除和时间戳复制(拉链表)

3. HVR在Greenplum上的案例(GE、天天拍车)

主题三:证券行业如何用Greenplum玩转大数据 

券商行业有很多特殊性,包括监管、交易、IT应用和数据环境。在这样的环境中,怎样让数据为产生更多的价值成为关键。此话题介绍了Greenplum作为数据的核心计算力,在证券行业中起到的作用。

演讲大纲:

1. 证券行业数据架构演进历史

2. 证券数据架构

3. Greenplum在数据架构中的作用

4. 数据仓库实践探讨

主题四:数据库上云最佳选择——Greenplum+Kubernetes

数据库容器化和分布式数据库上云一直是近几年云计算和大数据领域最具挑战性的领域。

Kubernetes,容器管理平台的事实标准以及云原生应用程序的基础设施,成为分布式数据库上云的最佳解决方案。本次演进将重点介绍开源分布式数据库Greenplum与Kubernetes结合的方案,以及如何通过Greenplum Operator对数据库在云端进行自动化部署和运维。最后,也将分享我们在这个过程中的积累的经验和学到的教训。

演讲大纲:

1. 云数据库背景介绍

2. Kubernetes简介

3. Greenplum on Kubernetes:数据库容器化解决方案

4. Greenplum Operator:数据库自动化部署及运维

5. 经验总结

嘉宾介绍

姚延栋,Pivotal 全球研发总监
作为Pivotal中国研发中心创始团队骨干成员,发起了Greenplum中国开源社区,同时领导Greenplum 和 HAWQ 中国工程团队成为大数据和机器学习意见领袖。加入 Greenplum/Pivotal之前, 曾在Sun Microsystem 与 Symantec 系统和存储部门工作多年. 于 2005年以荣誉研究生毕业于中科院软件所, 拥有多项国内外专利。

郭峰,Pivotal 中国研发中心 资深软件工程师
长期从事Greenplum内核的研发工作,目前主要从事PostgreSQL内核的代码合并,参与了PostgreSQL 9.1, 9.2, 9.3 和9.4的合并工作,同时活跃于PostgreSQL社区。加入Pivotal之前曾就职于EMC,从事Linux内核开发。

顾全,HVR中国技术总监中国科学技术大学计算机科学学士,上海交通大学MBA, 18年IT从业经验,专注于数据库技术领域,自2003年开始从事数据库实时复制技术的解决方案。2013年至2015年在SAP担任大数据和BI解决方案资深技术顾问,2015年加入HVR中国公司担任技术总监。

岳丰,中信证券信息技术中心数据平台总监
在证券行业信息技术部门任职25年,对券商的应用软件、自主开发和数据仓库等有深刻认识。带领中信证券数据团队,搭建了大数据技术架构,完善数据治理的实践,探索在风险、营销和管理领域全面用数据创造价值。

翁岩青,Pivotal 中国研发中心高级技术经理
Apache开源社区Committer和PMC成员,主要关注领域包括数据库内核,云数据库架构,Kubernetes等。