申请试用
HOT
登录
注册
 
基于PySpark的10亿级数据集LAION-5B元数据快速处理实践分享

基于PySpark的10亿级数据集LAION-5B元数据快速处理实践分享

1、多模态大规模数据集LAION-5B简介 2、LAION-5B Parquet元数据分析与预处理介绍 3、高效快速构建下载工具实战分享
时间
2023/05/17 19:00 - 20:00
人数
50
地点
研讨会直播
954人浏览
会议详情

5月17日(周三)19:00 上海人工智能实验室 OpenDataLab数据采集工程师 喻佳、张文坚 。欢迎大家报名~

1、多模态大规模数据集LAION-5B简介

2、LAION-5B Parquet元数据分析与预处理介绍

3、高效快速构建下载工具实战分享

活动
文档
专题
博客
确认
3秒后跳转登录页面
去登陆