申请试用
HOT
登录
注册
 
使用Apache Spark Pulkit Bhanot进行大规模的特征聚合

使用Apache Spark Pulkit Bhanot进行大规模的特征聚合

poppy
/
发布于
/
1729
人观看
基于聚合的特性占Uber的风险团队基于ML的决策系统使用的几个1000s特性的四分之一。我们观察到了一个重复的、繁琐的步骤,每一次都需要一个特征。因此,为了加快开发人员的速度,并大规模地启用Feature,我们决定开发一个基于spark的通用基础结构,以将过程简化为仅包含参数化查询的简单spec文件,以及一些关于该特性应该是收集并存储。在提交的报告中,我们将描述最后解决办法的结构,对一些有意义的能力建设的一些看法,作为一种辅助性的支持和自我保护。
6 点赞
1 收藏
0下载
相关文档
确认
3秒后跳转登录页面
去登陆