Apache Flink 社区举办的各类技术活动向来以内容充实著称,而 2019 年 6 月 29 日在北京望京召开的这场 Meetup,其嘉宾阵容与议题设置更是令人眼前一亮。从 Apache Flink 1.9 版本的新功能解析,到机器学习生态构建、Kubernetes 集成方案、高性能算法库,再到快手与 Airbnb 的一线实战经验,几乎囊括了当前 Flink 生态中最受关注的发展方向。接下来直接进入主题,为您呈现本次活动的完整详情。
时间:2019 年 6 月 29 日(周六)10:00-18:00
地址:北京市朝阳区望京浦项中心大楼 B 座二层 W1 多功能厅
嘉宾与议题介绍
议题一:《Apache Flink 1.9 特性解读》
戴资力(Gordon Tai)——Apache Flink PMC 成员,Ververica 软件工程师
作为 Flink 社区的 PMC 核心成员,Gordon 专注于 Flink 系统开发,在 Kafka / AWS Kinesis 精确一次连接、数据序列化框架、有状态流处理应用升级等方面贡献突出,曾多次在 Flink Forward 和 Strata Data 等国际会议上担任演讲嘉宾。
杨克特(花名:鲁尼)——Apache Flink Committer,阿里巴巴高级技术专家
2011 年硕士毕业于浙江大学后加入阿里巴巴,先后参与搜索引擎、调度系统、大数据处理等系统的研发工作,目前负责实时计算 Flink 的 SQL 引擎。
议题二:《打造基于 Flink Table API 的机器学习生态》
秦江杰——Apache Kafka PMC 成员,阿里巴巴高级技术专家
卡耐基梅隆大学硕士,曾任职于 LinkedIn 负责 Apache Kafka 开发,现为 Kafka PMC 成员,目前在阿里巴巴参与 Flink 开发。本次分享将重点探讨 Flink 社区如何基于 Table API 构建机器学习生态,包括近期对 Table API 的功能增强、针对机器学习场景的规划与当前进展。
议题三:《基于 Flink on Kubernetes 的大数据平台》
张凯——阿里云高级技术专家
负责容器服务 Kubernetes 产品的架构设计与研发,重点关注容器技术在异构计算、深度学习、边缘计算等场景中的落地实践。
任春德(花名:瓦力)——阿里巴巴高级技术专家
2006 年加入阿里巴巴,长期从事 Hadoop 相关大数据平台研发,目前负责 YARN 与 Flink 的资源调度工作,通过与 YARN 的深度对接,为实时计算提供大规模、高稳定、高性能的运行平台。
议题四:《基于 Apache Flink 的高性能机器学习算法库》
杨旭——阿里巴巴资深算法专家
负责阿里云机器学习算法平台 PAI 的基础算法研发,基于 Flink 搭建了批流一体的通用算法平台 Alink。Alink 已在阿里内部广泛使用,团队目前正积极推进开源,以回馈技术社区。本次演讲将分享在研发高性能 Flink 机器学习算法库过程中的技术积累与经验收获。
议题五:《Apache Flink 在快手的应用与实践》
董亭亭——快手实时计算引擎团队负责人
2013 年毕业于大连理工大学,曾任职于奇虎 360、58 集团,目前负责 Flink 引擎在快手的研发、应用及周边系统建设。Flink 在快手覆盖实时监控、统计分析、多源数据 join 等场景,集群规模超过千台,日处理数据条目超过 264 亿条,峰值处理能力达到 3.6 千万条/秒。本次分享将重点介绍实际运维中的稳定性与性能挑战及解决方案,包括 interval join 场景下 RocksDB backend 的性能瓶颈、多数据源取数速度差异引发的稳定性问题等。
具体提纲:
1. Flink 在快手的应用场景与集群规模
2. 快手 Flink 引擎的优化与改进策略
3. 后续发展规划
议题六:《Airbnb 实时流计算的架构与演进》
汪浩——Airbnb Data Platform Engineering Manager
南加州大学博士,现带领流计算团队为 Airbnb 提供全公司级别的实时流计算基础设施。曾任职于 IBM Watson,负责搭建 Watson 产品数据平台。主要研究领域包括实时流计算、大数据分析、自然语言处理。
议题七:《Apache Flink-1.9 与 Hive 的兼容性》
李锐——Apache Hive PMC 成员,阿里巴巴技术专家
曾任教于英特尔、IBM,参与 Hive、HDFS、Spark 等开源项目的研发。本次演讲将介绍 Flink 与 Hive 的集成项目(旨在完善 Flink SQL 的批处理能力),涵盖设计架构、Flink-1.9 版中的集成进展以及后续规划。
会议日程
9:00-10:00:签到入场
10:00-11:00:戴资力、杨克特《Apache Flink 1.9 特性解读》
11:00-11:15:茶歇交流
11:15-12:00:秦江杰《打造基于 Flink Table API 的机器学习生态》
13:00-14:00:下午签到
14:00-14:45:张凯、任春德《基于 Flink on Kubernetes 的大数据平台》
14:45-15:30:杨旭《基于 Apache Flink 的高性能机器学习算法库》
15:30-16:15:董亭亭《Apache Flink 在快手的应用与实践》
16:15-16:35:茶歇休息
16:35-17:20:汪浩《Airbnb 实时流计算的架构与演进》
17:20-18:05:李锐《Apache Flink-1.9 与 Hive 的兼容性》
18:05-18:30:抽奖环节、合影留念、会后自由交流


