- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
Apache SeaTunnel Examples 模块的使用和设计初衷 王健达
本次演讲将围绕Exmaples 模块,为大家分享我们为什么实现Exmaples 模块,以及 Exmaples 模块的使用方法,以及我个人参与开源贡献的一些感受。
展开查看详情
1 .Seatunnel Examples 模块使用和设计初衷 数数科技 2022-06-25
2 . 01 初识Seatunnel CONTENT 02 Examples模块设计与使用 03 我与开源社区
3 .01 初识Seatunnel
4 .二次开发生态 - 面向业务的数据中台能力 二次开发与数据集成平台 企业内部 Open API 业务系统 自定义表导入 数据回溯 Open API 数据归档 数据同步引擎 可视化配置 游戏客服系统 内部数据循环 数据接入层 游戏运营系统 数 运 数 业务应用层 维 分 外部数据交换 监 游戏业务数据库 析 控 系 实时计算层 层 统 三方数据(归因、 数据持久层 广告、成本等)
5 .数据同步场景-广告、变现、ROI打通 引流渠道成本 游戏内行为数据 广告收益 AF AD iS TOPON 用户群A View Ad1 Channel A View Ad2 AD1 Rev 用户群B 分配收入事件 View Ad1 Channel B View Ad2 AD2 Rev 用户群C View Ad1 Channel C View Ad2
6 .Datax VS Seatunnel Seatunnel Datax 通过Flink,Spark支持分布式读取 是否支持分布式 非分布式 写入 性能 可以达到Datax数倍 受限于单节点服务器性能 数据量支持 可以随着集群规模扩展 数据量大,不易扩容 插件化设计开源多个 插件化设计开源多个source, 扩展性 reader,writer ,transform局限性很 sink,transform⽀持良好 ⼤
7 .对Seatunnel 的印象 多引擎 简单易用 flink or spark 配置完成数据同步工作 丰富的数据源 apache 孵化 几十种数据源支持 积极的伙伴,稳定的团队
8 .02 Examples 模块 设计与使用
9 .为什么增加Examples模块? 便捷的本地开发调试 达到快速运行, 为学习研究提供更便 方便新插件的快速验 环境,无需远程调试, 得到直观效果 利的入口 证 部署调试 增加Examples 模块解决的问题
10 .Examples 模块设计和实现 Flink Examples 模块 Examples 模块 Spark Examples 模块 Flink SQL Examples 模块
11 .Examples 模块使用 Flink
12 .Examples 模块使用 spark
13 .Examples 模块使用 flink-sql
14 .Examples 模块使用 注意点
15 .03 我与开源社区
16 .第一次开源贡献 merge 前: 思悠悠,恨悠悠, 恨到归时方始休 仰天大笑出门去, merge 后: 我辈岂是蓬蒿人
17 .参与开源的些许感受 每个优化都有价值 不要忧虑这个优化值不值得提交,社区的进步是大家一行一行代码推动的。每一个 想法,每一个优化都有它的价值。 1 在帮助别人中成就自己 帮助小伙伴排查解决问题的过程中,你会打磨你排查问题的思路,历练你的技能, 同时还会得到小伙伴的认可 2 收获信心,收获友谊 自己贡献的功能,能被非常多的人用到,无疑是技术人收货信心,收货成就感的 点,在社区交流和互相协助过程中也会收获友谊 3
18 .开放的⼼态去创造 01 热情 善良 社区里有这样一群人,他们热情,他们善良,他们不 计得失,他们只为创造。 02 03 创造 开源生活
19 .Thank You 唯有数据,才能改变世界。 我们带着这样的信仰和梦想,做出了最好用的数据分析产品。 联系我们 13061961058 service@thinkingdata.cn www.thinkingdata.cn