- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 视频嵌入链接 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
公开数据集介绍
业界数据集也为研究者提供必要支持,为此Graviti计算机视觉算法工程师杨浩特将分享:如何让算法工程师专注于算法开发。
算法工程师在数据中被消耗,大量的时间囿于处理繁杂的数据工作。Graviti试图在数据的获取、托管、使用环节,给到开发者团队以深度的效率提升方案。公开数据集开源社区(OpenDatset)与非结构化数据管理工具(TensorBay)协同,解决AI开发中的数据痛点,让算法工程师专注于算法开发。
杨浩特 Graviti 计算机视觉算法工程师
毕业于上海交通大学计算机系CMACH实验室,研究方向生成对抗网络
展开查看详情
1 .Open Datasets 2021.01.26
2 .基本信息 Data Driven
3 .基本信息 自动驾驶 互联网泛 在线教育 娱乐 AI开放数 Data Driven 据集生态 智慧城市 新零售
4 .基本信息
5 .用户痛点 “想用算法解析世界,算法工程师却在数据里消耗” 想象中 实际上 专注算法模型 无尽数据处理
6 . 用户痛点 算法工程师体验 完成 技术路径调研 占据八成时间的繁杂数据工作 确定任务 编写代码训练 查找数据集 下载数据集 反复测试调试参数 数据可视化 筛选数据
7 .用户痛点 查找数据集 • 缺少统一平台 • 大海捞针
8 .用户痛点 查找数据集 下载数据集 • 缺少统一平台 • 申请石沉大海 • 大海捞针 • 海外数据集
9 .用户痛点 查找数据集 下载数据集 使用数据集 • 缺少统一平台 • 申请石沉大海 • 数据标注质量 • 大海捞针 • 海外数据集 • 可视化、筛选
10 .用户痛点 查找数据集 下载数据集 使用数据集 分享数据集 • 缺少统一平台 • 申请石沉大海 • 数据标注质量 • 移动硬盘 • 大海捞针 • 海外数据集 • 可视化、筛选 • 无法时刻同步
11 .基本信息 Open Datasets 海量优质公开数据集搜索、完全式托管、在线使用,与全球AI开发者共创公开数据集社区 • 1000+优质数据集 30+应用场景,20+标注类型,10+数据格式 • 完全免费获取 无限制的获取与使用数据集,助力AI开发落地 • 便捷云端使用 通过开发者工具无需下载即可云端读取数据
12 .基础功能 查找筛选 详情描述 在线可视 获取使用 社区支持 快捷的数据集查找与筛选 • 通过数据集名称联想检索查找 • 通过数据集的数据类型筛选 • 通过数据集的应用场景筛选 • 通过数据集的标注类型筛选 • 通过推荐、更新时间及热度筛选
13 .基础功能 查找筛选 详情描述 在线可视 获取使用 社区支持 数据集信息的结构化描述 明晰的信息展示方式,提升用户阅读体验 • 数据应用场景、标注信息结构化 • 数据概要信息结构化 • 数据协议信息结构化
14 .核心功能 查找筛选 详情描述 在线可视 获取使用 社区支持 组件式在线数据可视化工具 无需下载、另写代码即可让数据集信息一目了然 • 原数据可视化 • 标注数据可视化 • 标签分布可视化 可视化组件形式 支持层级式数据列表与数据视图交互展示 支持多种可视化组件分享形式(URL / IFRAME) 数据布局自由调整:全屏、缩放;PC、移动端兼容适配
15 . 核心功能 查找筛选 详情描述 在线可视 获取使用 社区支持 支持查看主流的图片与视频数据 标注数据可视化 • 主流的图片与视频数据 • 支持查看主流的标注类型 标签分布可视化 • 多种样式查看标签分布
16 .核心功能 查找筛选 详情描述 在线可视 获取使用 社区支持 Fork - 获取数据集 Open Datasets TensorBay 统一数据结构调用代码,无需担心数据格式转换
17 .核心功能 查找筛选 详情描述 在线可视 获取使用 社区支持 Tensorbay 非结构化数据云端管理SaaS,为AI开发者与开发团 队提供数据托管、版本管理、数据协同等服务 • 安全可靠的数据云端托管 • 清晰可溯的版本管理 • 便捷高效的数据可视化 • 赋能开发者团队的数据协同 • 简单易用的开发者工具
18 .核心功能 查找筛选 详情描述 在线可视 获取使用 社区支持 安全可靠的数据云端托管 • 数据的完全托管,支持本地上传与云数据迁移,动态扩容 • 数据的授权托管,支持通过云服务授权对已有数据进行管理 • 支持Classification、2D Box、2D Polygon等主流标注类型 • 支持管理追踪、多传感器等复杂结构数据 清晰可溯的版本管理 • 支持创建新、切换版本,为版本标记Tag • 支持可视化查看版本迭代情况 • 支持查看历史版本数据,每次变更都可追溯 • 支持快速从已有数据集创建新的数据集,而无需增加存储开销
19 .核心功能 查找筛选 详情描述 在线可视 获取使用 社区支持 赋能开发者团队的数据协同 • 支持团队内数据集的查看与检索 • 支持数据集维度独立管理权限 • 支持数据集使用的申请与授权 • 支持多种角色的数据集使用权限管理 简单易用的开发者工具 • 支持PythonSDK创建、上传、管理、读取数据 • 支持CLI(Command-line Interface)管理数据 • 支持OpenAPI创建、上传、管理、读取数据 • 支持完善的文档、使用案例与在线问题反馈
20 .核心功能 查找筛选 详情描述 在线可视 获取使用 社区支持 完善的社区支持模块 为社区用户提供问题与需求的反馈渠道,为发布方 提供收集渠道,快速解决数据集需求与问题 • 支持用户创建问题/需求,关联对应数据集 • 可实时同步提出人及订阅人问题/需求的排期、处 理进度 • 支持用户回复,并且同步提出人
21 .核心功能 查找筛选 详情描述 在线可视 获取使用 社区支持 ◼ 上线规划、进度 ◼ 订阅通知 → 同步处理进度
22 .公开数据集展望 TensorBay 数据托管 数据集社区 数据集版本 提出数据集需求 OpenDatasets 数据集权限管理 反馈数据集问题 发现数据集 数据集操作记录 获取数据集 数据集相关建议 关注数据集 数据集交流讨论 分享数据集
23 .公开数据集展望 学术社区 更好的数据支持 推进成果的传播 公开数据集社区 最受开发者欢迎 领先企业 数据集发布管理 提升品牌影响力 现有合作伙伴:
24 .公开数据集展望 学术社区 更好的数据支持 推进成果的传播 敬请期待 公开数据集社区 issue功能 最受开发者欢迎 企业主页 领先企业 数据集发布管理 提升品牌影响力 现有合作伙伴:
25 .Thanks for your Time 2021.01.26