白玉兰开源介绍

构建人工智能创新生态,助力上海人工智能高地打造,推进人工智能软件框架研发与开源,与国内外知名开源社区互联互通,汇聚国内外开发者智慧 特别是国际知名开源开发者与科学家,以开源社区平台为牵引,以提升先进算法和模型的可复现性为目标,推动人工智能领域开源产品的国际规则互认,在重点领域形成“算力、算法、数据、 场景、合规”一体化的人工智能社区,建设国际人工智能开发生态网络的关键节点。

展开查看详情

1.上海白玉兰开源开放研究院 上海交通大学人工智能研究院 2020年9月15日

2.人工智能与经济社会发展深度融合面临的痛点 AI如何快速落地? AI平民化 痛点1、传统行业缺信心 • 想拥抱没信心,想拒绝怕被弃 痛点2、巨头企业缺生态 • 营造生态不容易,存在产业链断裂的风险 痛点3、中小企业缺技术 • 面临人才困境和技术困境,可持续发展与盈利能力较弱 痛点4、科研院校缺落地 • 远离业务场景,依赖国外数据,偏重算法论文 痛点5、政府部门缺智库 • 顶层设计、科学立项、治理监管、绩效评估的智库需求强烈

3.人工智能平台的主流和趋势:开源开放 人工智能是现代IT技术的重大集 成,其发展离不开开源软件、开 源硬件、开放标准、开放云以及 开放数据等。 新一代人工智能天生无法与数 据分割开来,高质量的训练和 测试数据集是机器学习技术突 破、人工智能规模化应用等的 必备资源,这些数据集供给归 根结底离不开行业、领域等数 据的开放。 金耀辉等:“激活AI创新之源——人工智能开源开放发展报告”,WAIC 2020

4.中国人工智能发展必须坚持开源开放 开源开放 不仅仅是建立一个类似Github的开源代码托管平台 开源开放 需要强大的硬件生态、软件生态和应用生态 开源开放 不仅是代码和技术开源,而且是文化与组织的变革 人工智能开源开放离不开数据共享与融合 人工智能开源开放的挑战 法律问题 潜在锁定 安全隐患 标准统一 版本兼容 行业应用

5.上海白玉兰开源开放研究院的愿景 上海白玉兰开源开放研究院,Baiyulan Open Labs (www.baiyulan-ai.org.cn) 白玉兰是上海的市花,象征着一种开路先锋、奋发向上的精神。中国的开源开放需要这 种开路先锋、奋发向上的精神。 白玉兰花语含义是纯真的爱、真诚、尊贵出尘,中国的开源需要这种心态,参与融入、 蓄势引领,全面拥抱开源文化,积极融入开源社区,争取开源话语权,转变自主创新观 念,发扬开源协作创新精神,合理应用开源技术成果为国民经济服务。 白玉兰开源开放研究院鼓励采用木兰宽松许可证,木兰玉兰同属一科,一脉相承。 白玉兰——“奋发向上”之花 白玉兰开源——“新时代”智花

6.建设思路 特色 参与融入、蓄势引领,扎根上海、面向全球,聚焦人工智能生态 国际化 发挥上海国际化优势,引驻人工智能国际知名开源开发者与学者 合作 与国家平台、鹏城实验室、之江实验室的分工合作、优势互补 规则 以木兰宽松许可证为抓手,探索人工智能的伦理与安全标准及国际互认

7.国际对标:欧盟地平线2020项目 AI4EU 2019年开始,投资2000万欧元,近80个学术和企业成员 建立第一个欧洲人工智能云平台与生态 收集和共享欧洲项目中产生的AI资源包含 AI组件和ML模型 人工智能研究与创新方面的专业知识 高质量数据集 提供一个试验场来建立可复现AI实验 建立欧洲道德观察站,以确保欧洲AI项目遵守严格的道德,法律和社会经济标准

8.建设目标与任务 构建人工智能创新生态,助力上海 人工智能高地打造 推进人工智能软件框架研发与开源,与国内外知 名开源社区互联互通,汇聚国内外开发者智慧, 特别是国际知名开源开发者与科学家,以开源社 区平台为牵引,以提升先进算法和模型的可复现 性为目标,推动人工智能领域开源产品的国际规 则互认,在重点领域形成“算力、算法、数据、 场景、合规”一体化的人工智能社区,建设国际 人工智能开发生态网络的关键节点。

9. 建设内容与形态 协调各方资源,实现行业场景和数据开放,帮助中小企业和科研机构利用巨头企业 的开源开放框架服务传统行业,服务科学决策、承担智库功能。 Linked Data and Security 行业场景与 关联数据与安全 政务服务 金融科技 … 数据资源知 人工智能开放场景 识库 建设内容 原始数据 场景数据 ◼ 系统验证 ◼ 行业场景 ◼ 开发者社 与合规评 与数据资 区与STAR 开发者社区与 人工智能 数据 AI 应用 人工智能 系统验证与 测实验室 源知识库 项目池 STAR项目池 开发平台 模型 Marketplace 代码 异构系统 合规评测实 框架 论文 算法 数据 任务 验室 Linux … TensorFlow CPU/NPU/Linux/ 政务服务/车联网/ 可复现性与产品原 PyTorch CPU NPU Mindspore OS… 泛金融科技/医疗 型快速迭代 健康… 工具、评测、治理、监管 Short Term Accelerated Release AI Standard and Safety STAR项目 快速原型 AI伦理与安全

10.新型AI开发者社区与STAR项目:提升可复现性 AI研发特点:工具太新、发展太快 STAR: Short Term Accelerated Release 研究课题:2年 中长期科研 STAR项目:2周-2月-2季度 需求设定、论文复现、原型验证、系统优化 Hackathon:2时-2天 技术布道、技能学习、开源文化 时间 STAR项目的特点,中小企业与科研院校合作,交付传统企业或孵化产品 随着白玉兰开源网站同步上线。

11. 一体化开源开放社区 知识协作 任务分类 模型检索 数据关联 信息抽取 论文 代码 数据 模型 任务 模型 框架 数据 硬件 公共AI仓库

12.可复现开源开放技术架构 论文复现-产品复制 科研 产品 原型开发终端 算力验证平台 真实生产环境 性能 SOTA 比简单的模型略好 优先考虑 训练速度 推理速度 系统管理 数据工程师 数据 静态 不断变化 数据科学家 公平性 锦上添花 重要 机器资源 数据 的管理和 可解释性 锦上添花 重要 验证 监控 模型 监视 复杂性 可接受 不可实施 服务 难点 建模 无处不在 配置 数据收集 机器 架构 分析工具 …… 学习 ◼ 端到端AI模型流水线 ◼ 从单机开发到集群部署运行代码“零”变化 特征提取 过程管理工具 ◼ 在大数据/云计算集群上无缝部署 ◼ 深度学习的自动化流程

13.面向不同类型用户的开源开放社区 专业 伯禹/ACM社区 示说网 高校 B站/ 官方社区/抖睿 企业 抖音 社区 和鲸社区 行业

14.SJTU顶会AI论文开源项目 2017-2020年,上海交通大学在CCF A 类会议上共发表371篇, AAAI 位列大陆高校前5。 CVPR 其中开源项目107个,托管于github NeuIPS ICCV 2017, Alphapose, 4172 star, 14 contributors CVPR 2019, DAIN, 3531 star, 8 contributors CVPR 2019, DenseFusion, 615 star, 4 contributors ICCV ICML 2019, SGC, 450 star, 4 contributors ACL NeuIPS 2019, PVCNN, 248 star, 3 contributors NeuIPS 2018, Co-teaching, 227 star, 3 contributors CVPR 2019, COSNet, 213 star ICML …… IJCAI Contributors! Contributors! Contributor! 作为对比,近3年顶会最多Star开源AI论文项目,ICML 2018,RLlib (UC Berkeley), 12466 star, 336 contributors

15.总结:白玉兰开源近期主要工作 基本面:推出服务社会品牌项目 牵引线:构建开源开放知识图谱 闪光点:实现开源开放标志成就 操作块:深入参与一线行业实践

16.参与融入 蓄势引领