Acclerating Production Machine Learning with MLFlow

一次性成功训练和部署机器学习模型是很困难的,让其他数据科学家(包括你自己)过一段时间重做一次,来复现完整的流水线,并跟踪比较不同模型的运行结果,且能随时重新部署或者回滚更新后的模型,这一过程就更加困难了。 在这篇PPT中,大神Matei介绍Databricks的新开源项目MLflow,它致力于减轻机器学习完整生命周期中训练和部署的维护代价。MLflow提供了API,在一个可复现的环境中,可以跟踪不同用户的实验结果,以此可以很好管理和部署生产环境中不同版本的训练模型。MLflow是一个开放的,模块化的平台,它可以和很多其它机器学习库很好配合,并维护其发布流程。自2018年6月份发布以来,已经合并了不少重要的由社区贡献的patch,有45个代码贡献者提交了新的特性以及新的语言支持API,并与一些流行的机器学习库有很好的集成,此篇PPT会介绍最新的MLflow特性,并解释如何开始使用MLflow。
展开查看详情

1.

2.

3.

4.

5.

6.

7.

8.

9.

10.

11.

12.

13.

14.

15.

16.

17.

18.