Large Scale Matrix Operations using a Data Flow Engine

随着数据量越来越大,并行处理是不可或缺的数据处理手段,传统数据处理网络模型(比如:MPI)和Spark的DataFlow模型相比,水平扩展的难度要大很多,Apache Spark的创造者Matei介绍了Spark的数据流模型,并用实际案例证明明显的性能优势和API使用的简易程度。
展开查看详情