申请试用
HOT
登录
注册
 
使用BigSift自动调试 Apache Spark中的大数据分析

使用BigSift自动调试 Apache Spark中的大数据分析

poppy
/
发布于
/
1787
人观看
由于数据集的不洁性质或对数据的错误假设,开发大数据分析经常涉及试验和错误调试。数据科学家通常编写实现数据处理管道的代码,并在他们的本地工作站上用从结核病规模数据仓库下载的小样本数据进行测试。他们互相祈祷,希望程序能在昂贵的生产云中工作。当一个工作失败或者他们得到一个可疑的结果时,数据科学家花费数小时猜测错误的来源。
10 点赞
4 收藏
0下载
相关文档
确认
3秒后跳转登录页面
去登陆