申请试用
HOT
登录
注册
 

Apache Spark 中的列式存储和向量化优化

Apache Spark中国技术交流社区
/
发布于
/
6775
人观看

7月24日【Apache Spark 基于 Apache Arrow 的列式存储优化】

主讲人:诚历,阿里巴巴计算平台事业部 EMR 技术专家,Apache Sentry PMC,Apache Commons Committer,目前从事开源大数据存储和优化方面的工作。

简介:Apache Arrow 是一个基于内存的列式存储标准,旨在解决数据交换和传输过程中,序列化和反序列化带来的开销。目前,Apache Spark 社区的一些重要优化都在围绕 Apache Arrow 展开,本次分享会介绍 Apache Arrow 并分析通过 Arrow 将给 Spark 带来哪些特性。

阿里巴巴开源大数据EMR技术团队成立Apache Spark中国技术社区,定期打造国内Spark线上线下交流活动。请持续关注。
钉钉群号:21784001
团队群号:HPRX8117
微信公众号:Apache Spark技术交流社区

8点赞
3收藏
确认
3秒后跳转登录页面
去登陆