申请试用
HOT
登录
注册
 

7. Ray助力 Byzer 实现分布式 Python Run- time 祝威廉

Ray中文社区
/
发布于
/
964
人观看

这次分享,我们会介绍Byzer如何打通Spark和Ray之间的数据通路,在SQL和Python之间实现数据协作,同时介绍相比PySpark的实现的一些优缺点。现场我们会演示用户如何通过Byzer完成利用SOL抽取各种数据源的数据,然后转化为分布式Pandas数据集合(DaskonRay)进行操作,最后重新返回成表继续使用SQL处理的流程。本文全程使用第三代Note- book产品,Byzer Notebook来演示。 祝威廉,Byzer社区PMC,资深数据架构师,Kyligence技术合伙人

1点赞
0收藏
确认
3秒后跳转登录页面
去登陆