Apache Spark中国技术交流社区
通过LLVM加速SparkSQL时间窗口计算
2020/07/09 19:00 - 20:30

讲师介绍:

王太泽
第四范式特征工程数据库负责人
曾在百度担任资深研发工程师
一直致力于解决机器学习模型从离线到在线特征一致性问题和性能问题。

议题简介

  • 为什么要优化spark时间窗口
  • 未加速前面临问题
  • 为什么要使用llvm加速而不是继续优化jvm codegen
  • 实现介绍-llvm 版本sql引擎设计
  • 如何与spark集成
  • benchmark数据 vs spark3.0
    7月9日.png
“回车”发送消息