- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 视频嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
7. Ray助力 Byzer 实现分布式 Python Run- time 祝威廉
分享
点赞
1
收藏
0
这次分享,我们会介绍Byzer如何打通Spark和Ray之间的数据通路,在SQL和Python之间实现数据协作,同时介绍相比PySpark的实现的一些优缺点。现场我们会演示用户如何通过Byzer完成利用SOL抽取各种数据源的数据,然后转化为分布式Pandas数据集合(DaskonRay)进行操作,最后重新返回成表继续使用SQL处理的流程。本文全程使用第三代Note- book产品,Byzer Notebook来演示。 祝威廉,Byzer社区PMC,资深数据架构师,Kyligence技术合伙人
展开查看详情
1点赞
0收藏
确认
3秒后跳转登录页面
去登陆