- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
AIGC 发展大年,推动新一轮产业革命
算法层 ChatGPT 底层的大模型技术演进。大模型是在大规模无标注数据上进行训练,学习出特征和规则,泛化能力强。大模型技术的兴起,有效降低了 AI应用研发门槛,也能解决在特定应用场景有效数据不足导致模型精度低的问题。现阶段的大模型主要是面向 NLP 领域,包括 ChatGPT 背后的GPT-3,而在 CV 领域,多个公司也在积极加大技术储备。针对 5 年来中美发布的主要大模型,我们从两个维度进行了比较:1)在模型参数量上,模型体量随时间呈指数扩张趋势,美国同等参数量级的大模型比中国领先 1-2年;2)在 NLP 专利数量上,微软和谷歌的持有数已经在几千个的量级,而国内领先的 BAT 持有数则在 600 个左右。 算力层 大模型驱动 AI/内存芯片需求全面加速。AI 芯片为人工智能应用提供所需的基础算力,主要分为 GPU、FPGA 和 ASIC,ChatGPT 基础模型上大规模预训练需要强大算力作为支持,而大算力需要更多高算力和内存芯片去支撑算法运行。目前 GPU 为主导 AI 芯片,因具有强大计算能力和高通用适用性,广泛应用于 AI 和机器学习领域。近年多家国内半导体公司积极布局GPU 领域,受中美科技摩擦影响,预计国产 GPU 芯片替代将快速推进。 应用层 搜索+智能客服先行,内容创作+文娱生活场景渗透加速,长期看好B 端产业机会。进入“数智化时代”,看好 ChatGPT/AIGC 应用场景持续渗透及商业化加速 (包括搜索引擎、智能客服、教育培训、金融等),助力行业降本增效的同时,开拓创新变现增量。我们认为 ChatGPT 较难取代搜索引擎,更多体现在赋能优化,在于离线非实时数据库、训练模型下答案非正确、成本过高。中短期,基于内容创作及文娱生活导向的 AIGC 场景应用更为集中,包括文娱、传媒、电商等,长期产业升级机会可期。预计 2030 年AIGC 市场规模达千亿美元,商业模式从按量付费、订阅延伸至 MaaS。 受益标的 在 ChatGPT/AIGC 应用层面,建议重点关注拥有海量数据、大模型能力及 AI 内容创作产品丰富 (文/音/图/视)的头部平台,包括 OpenAI、微软、谷歌、Meta、百度、腾讯、阿里、字节;可同时关注近期推出类ChatGPT 服务或泛 AI 产品的垂类腰部平台,如网易、知乎、阅文、昆仑万维等。我们看好百度在 ChatGPU 及 AIGC 的全栈技术储备、搜索引擎协同及产品管线,受益于:1)文心一言待推出,数字人+智能创作应用矩阵丰富;2)文心大模型技术支持及海量数字资产优势 (语料库、参数量大)。在AI 底层算法领域,建议关注拥有 CV 大模型的商汤及在智能语音技术领先的科大讯飞。在芯片算力领域,建议关注 GPU 领先企业景嘉微、寒武纪、海光信息和龙芯中科,以及 FPGA 龙头紫光国微和复旦微电。
展开查看详情
1 .\\\\\\\\\ \\ 2023 年 2 月 10 日 招银国际环球市场 | 睿智投资 | 行业研究 ChatGPT 跨行业专题报告 AIGC 发展大年,推动新一轮产业革命 近年全球科技龙头持续投入 AIGC 领域以及近期 ChatGPT 应用落地加速,我们 伍力恒 认为 2023 年 AIGC 大模型与产业将迎来快速发展期,赋予人工智能大规模落地 (852) 3900 0881 场景,为底层算法和芯片等领域带来巨大需求,同时加速 AIGC 应用渗透和商业 alexng@cmbi.com.hk 化进程。在本篇报告中,我们对 ChatGPT/ AIGC 算法层、算力层和应用层的发 黄群 展和产业链进行深度分析,建议重点关注上游算法商汤和科大讯飞,中游芯片景 (852) 3900 0889 sophiehuang@cmbi.com.hk 嘉微和寒武纪,及下游应用微软、谷歌、Meta、百度、腾讯、阿里和字节。 算法层:ChatGPT 底层的大模型技术演进。大模型是在大规模无标注数据 颜宇翾 上进行训练,学习出特征和规则,泛化能力强。大模型技术的兴起,有效降 (852) 3916 3719 marleyngan@cmbi.com.hk 低了 AI 应用研发门槛,也能解决在特定应用场景有效数据不足导致模型精度 低的问题。现阶段的大模型主要是面向 NLP 领域,包括 ChatGPT 背后的 杨天薇博士 GPT-3,而在 CV 领域,多个公司也在积极加大技术储备。针对 5 年来中美 (852) 3916 3716 lilyyang@cmbi.com.hk 发布的主要大模型,我们从两个维度进行了比较:1)在模型参数量上,模 型体量随时间呈指数扩张趋势,美国同等参数量级的大模型比中国领先 1-2 李汉卿 年;2)在 NLP 专利数量上,微软和谷歌的持有数已经在几千个的量级,而 lihanqing@cmbi.com.hk 国内领先的 BAT 持有数则在 600 个左右。 刘梦楠 算力层:大模型驱动 AI/内存芯片需求全面加速。AI 芯片为人工智能应用提 claudialiu@cmbi.com.hk 供所需的基础算力,主要分为 GPU、FPGA 和 ASIC,ChatGPT 基础模型上 大规模预训练需要强大算力作为支持,而大算力需要更多高算力和内存芯片 许义鑫 easonxu@cmbi.com.hk 去支撑算法运行。目前 GPU 为主导 AI 芯片,因具有强大计算能力和高通用 适用性,广泛应用于 AI 和机器学习领域。近年多家国内半导体公司积极布局 李博文 GPU 领域,受中美科技摩擦影响,预计国产 GPU 芯片替代将快速推进。 libowen@cmbi.com.hk 应用层:搜索+智能客服先行,内容创作+文娱生活场景渗透加速,长期看好 B 端产业机会。进入“数智化时代”,看好 ChatGPT/AIGC 应用场景持续渗透 及商业化加速 (包括搜索引擎、智能客服、教育培训、金融等),助力行业降 本增效的同时,开拓创新变现增量。我们认为 ChatGPT 较难取代搜索引 擎,更多体现在赋能优化,在于离线非实时数据库、训练模型下答案非正 确、成本过高。中短期,基于内容创作及文娱生活导向的 AIGC 场景应用更 为集中,包括文娱、传媒、电商等,长期产业升级机会可期。预计 2030 年 AIGC 市场规模达千亿美元,商业模式从按量付费、订阅延伸至 MaaS。 受益标的:在 ChatGPT/AIGC 应用层面,建议重点关注拥有海量数据、大模 型能力及 AI 内容创作产品丰富 (文/音/图/视)的头部平台,包括 OpenAI、微 软、 谷歌、 Meta、 百度、腾讯 、阿里、字 节;可同时关 注近期推出 类 ChatGPT 服务或泛 AI 产品的垂类腰部平台,如网易、知乎、阅文、昆仑万 维等。我们看好百度在 ChatGPU 及 AIGC 的全栈技术储备、搜索引擎协同 相关报告: 及产品管线,受益于:1)文心一言待推出,数字人+智能创作应用矩阵丰 富;2)文心大模型技术支持及海量数字资产优势 (语料库、参数量大)。在 中国互联网行业 – ChatGPT & AI 底层算法领域,建议关注拥有 CV 大模型的商汤及在智能语音技术领先的 AIGC 在中国市场的发展前景 科大讯飞。在芯片算力领域,建议关注 GPU 领先企业景嘉微、寒武纪、海 (link) 光信息和龙芯中科,以及 FPGA 龙头紫光国微和复旦微电。 Acces sor Accessor 敬请参阅尾页之免责声明 1 请到彭博 (搜索代码: RESP CMBR <GO>)或 http:// www.cmbi.com.hk 下载更多招银国际环球市场研究 报告
2 .2023 年 2 月 10 日 大模型产业链及潜在受益标的 图 1:大模型产业链梳理 下游产业 重点领域 社交 媒体 营销 教育 娱乐 重点场景 内容生产 创意设计 对话引擎 辅助开发 产 中游产业 业 链 算法研发 模型管理维护 方 向 编程语言 训练框架 模型测评 系统管理 API管理 数据处理 上游产业 硬件 软件 芯片 服务器 高速互联网络 云技术 数据库 容器/虚拟化技术 资料来源:智源研究院, 招银国际环球市场 图 2:大模型产业链投资标的 产业链 国外潜在受益标的 国内潜在受益标的 微软、谷歌、Facebook 百度、腾讯、阿里巴巴、字节跳动、华为、 应用 商汤、科大讯飞、思必驰 深度学习框架 谷歌(TensorFlow)、 百度(PaddlePaddle)、 Facebook (PyTorch)、 华为(MindSpore) AI 模型、算法 微软(CNTK) 商汤(SenseParrots) 大模型 微软、谷歌、Facebook 百度、腾讯、阿里巴巴、商汤 CPU Intel GPU Nvidia,AMD 华为昇腾,燧原科技,壁仞科技 FPGA Intel,Xilinx 基础计算设施 ASIC 百度,复旦微电,寒武纪 服务器周边 澜起科技、中际旭创 数据中心 Equinix 万国数据、秦淮数据 资料来源:招银国际环球市场 敬请参阅尾页之免责声明 2
3 .2023 年 2 月 10 日 受益标的估值比较 图 3:受益标的估值比较 股价 市值 P/E P/B ROE 公司 代码 产品 (当地货币) (百万美元) FY23E FY24E FY23E FY24E FY23E 云计算 微软 MSFT US AI 云计算 266.73 1,985,486 28.6 24.8 9.3 7.3 36.4 谷歌 GOOG US AI 云计算 100 1,276,670 18.2 15.2 4.5 3.9 24.6 百度 BIDU US AI 云计算 152.34 52,641 16.5 14.6 1.6 1.7 7.3 腾讯 700 HK AI 云计算 395.6 481,702 23.4 20.0 3.2 2.8 14.4 阿里巴巴 BABA US AI 云计算 105.11 278,282 13.4 13.3 2.2 2.3 8.7 AI 算法 商汤 20 HK AI 算法及应用 2.78 11,853 n.a. n.a. 3.2 3.5 (11.7) 科大讯飞 002230 CH AI 算法及应用 46.4 15,911 51.5 38.5 5.4 5.0 11.3 创新奇智 2121 HK AI 算法及应用 20 1,425 n.a. n.a. 4.8 5.2 (14.6) 虹软科技 688088 CH AI 算法及应用 28.73 1,721 42.3 29.5 3.8 3.3 7.8 云从科技 688327 CH AI 算法及应用 31.7 3,465 n.a. n.a. 12.0 12.2 (26.7) 芯片 英伟达 NVDA US GPU 222.05 546,243 68.1 51.3 25.6 23.0 31.1 超威半导体 AMD US GPU 84.69 136,550 27.1 19.7 2.4 2.3 7.4 寒武纪 688256 CH GPU 79.07 4,677 n.a. n.a. 7.0 7.4 (15.9) 景嘉微 300474 CH GPU 82.67 5,545 80.3 58.2 10.5 9.1 12.7 海光信息 688041 CH CPU 53.51 18,353 82.3 56.3 7.6 6.7 10.9 龙芯中科 688047 CH CPU 113 6,687 101.5 76.4 8.9 8.0 8.9 莱迪思 LSCC US FPGA 81.41 11,158 40.3 34.3 n.a. n.a. 50.7 安路科技 688107 CH FPGA 73.03 4,312 308.1 138.8 18.1 16.3 5.8 紫光国微 002049 CH FPGA 126.85 15,903 26.3 19.9 7.6 5.5 30.5 复旦微 1385 HK FPGA 33.7 6,942 19.1 17.3 4.7 4.0 22.0 航锦科技 000818 CH FPGA 34.06 3,413 n.a. n.a. n.a. n.a. n.a. 兆易创新 603986 CH DRAM 118.08 11,623 28.5 25.4 4.5 3.9 15.3 数据中心 易昆尼克斯 EQIX US IDC 730.99 67,644 79.4 67.7 6.1 6.2 8.0 万国数据 GDS US IDC 25.03 4,770 n.a. n.a. 1.6 1.7 (6.4) 秦淮数据 CD US IDC 8.84 3,243 26.1 21.0 2.0 1.8 9.7 资料来源:彭博、招银国际环球市场 敬请参阅尾页之免责声明 3 9XhXgUxX9WfVoOqRaQ9RbRtRnNnPnOlOoOsQjMoPrR7NnNyRMYmOzQwMqQtQ
4 .2023 年 2 月 10 日 目录 大模型产业链及潜在受益标的.......................................................................................... 2 受益标的估值比较 ........................................................................................................... 3 追本溯源:ChatGPT 的概述及现状 ................................................................................. 5 什么是 ChatGPT? ....................................................................................................... 5 ChatGPT 商业化落地的限制? ...................................................................................... 6 从小模型到大模型的兴起 ............................................................................................. 7 自然语言处理(NLP)大模型 ...................................................................................... 8 计算机视觉(CV)大模型 ........................................................................................... 8 多模态模型.................................................................................................................. 9 算力层:大模型驱动 AI/内存芯片需求全面加速 ............................................................. 10 AI 芯片 ...................................................................................................................... 10 内存芯片 ................................................................................................................... 14 应用层:AIGC 万亿市场可期,大模型+内容生态为关键 ................................................ 15 场景应用:搜索+智能客服先行,内容创作+文娱生活加速落地,长期 B 端产业升级可期 ................................................................................................................................. 15 变现空间: AIGC 万亿市场可期,订阅付费加速商业化,MaaS 探索长期增长点........... 16 中美对比:美国底层技术领先,中国内容场景多点开花 ................................................. 18 中美引领全球预训练大模型发展,美国底层技术领先 ................................................. 18 技术面:数据及大模型参数量差距较小,算力和模型迭代仍需精进 ............................ 19 应用面:美国商业化加速、赋能 2B;中国变现早期,侧重生活互娱 C 端场景 ............ 20 潜在受益标的 ................................................................................................................ 22 微软(MSFT US)- 深度融合 OpenAI 工具,技术和应用并行........................................ 23 谷歌(GOOG US)- 发布“Bard AI”及开放生成语言 API, LaMDA 大模型积淀深厚 .......... 24 百度(9888 HK)- 全栈式 AI 技术先锋,文心一言+数字人+AI 创作平台矩阵丰富 .......... 25 腾讯 (700 HK) - 混元 AI 大模型赋能多业务场景落地、实现技术提效 .............................. 27 阿里巴巴 (BABA US) - 通义大模型凸显开源,构建 AI 统一底座..................................... 29 商汤(20 HK)- 拥有 300 亿参数视觉大模型 ................................................................. 31 科大讯飞(002230 CH)- AI 语音市场龙头 ................................................................... 32 思必驰(未上市)- “云+芯”渗透 AI 语音语义市场 ........................................................... 33 英伟达(NVIDIA,NVDA US)- 全球 AI 计算平台龙头 .................................................. 34 超威半导体(AMD,AMD US)- CPU+GPU 双芯片行业龙头 ....................................... 34 莱迪思(Lattice, LSCC US)- 全球领先 FPGA 供应商................................................... 35 景嘉微(300474 CH)- 国产 GPU 龙头企业 .................................................................. 35 寒武纪(688256 CH)- 国内 AI 芯片领先者................................................................... 36 海光信息(688041 CH)- 中国微处理器领军者 ............................................................. 37 龙芯中科(688047 CH)- 国产 CPU 龙头企业 .............................................................. 37 紫光国微(002049 CH)- 特种集成电路龙头................................................................. 38 航锦科技(000818 CH)-军工/电子/化工三大业务板块驱动成长 .................................... 39 安路科技(688107 CH)- 国内领先的 FPGA 芯片供应商 .............................................. 40 复旦微电(688385 CH)- FPGA 平台型公司................................................................. 40 兆易创新(603986 CH)- DRAM 龙头企业,自有品牌广泛应用 .................................... 41 敬请参阅尾页之免责声明 4
5 .2023 年 2 月 10 日 追本溯源:ChatGPT 的概述及现状 什么是 ChatGPT? ChatGPT 是 OpenAI 于 2022 年 11 月推出的一款聊天机器人(AI Chatbot),它是基于 GPT-3.5 (GPT-3 的改进版)模型的变体。ChatGPT 可以在对话中根据上下文形成类似人 类的文本响应,与其他使用预定义的响应或规则生成文本的聊天机器人不同,ChatGPT 可 以根据接收到的输入生成响应,从而生成更自然、更多样化的响应。ChatGPT 不仅是聊天 机器人,还能进行撰写邮件、文案、代码等任务。从 2022 年 11 月上线以来,在 ChatGPT 上的累积用户已经达到 1 亿。 图 4:OpenAI 及 ChatGPT 的发展历程 年份 大事记 作为 AI 研究实验室,OpenAI 在美国正式成立 2015 Y Combinator 的 Sam Altman 和 Elon Musk 作为 OpenAI 的首届联合主席 Elon Musk 离开 OpenAI,Sam Altman 成为了 OpenAI 的 CEO 2018 发布通用 NLP 模型 GPT,含 1.17 亿参数 微软(MSFT US)向 OpenAI 投资 10 亿美元 2019 发布 GPT-2,含 15 亿参数 OpenAI 发布 GPT 3,含 1,750 亿参数 2020 微软取得 GPT-3 的独家授权 发布 CLIP,匹配图像和文本的预训练大模型 2021 发布 DALL·E,文字生成图像 AI 系统 发布 DALL·E 2 2022 推出 ChatGPT 聊天机器人,5 天内注册用户超过 100 万 微软宣布旗下所有产品将全线整合 ChatGPT,除了搜索引擎 Bing 和 Office 外,微软将在 Azure 云平台整 2023 合 ChatGPT,Azure 的 OpenAI 服务将允许开发者访问 AI 模型 微软宣布将向 OpenAI 追加投资数十亿美元 资料来源:OpenAI, 微软,招银国际环球市场 图 5:ChatGPT 使用示意 图 6:ChatGPT 使用示意 资料来源:ChatGPT, 招银国际环球市场 资料来源:ChatGPT, 招银国际环球市场 敬请参阅尾页之免责声明 5
6 .2023 年 2 月 10 日 ChatGPT 商业化落地的限制? 虽然 ChatGPT 的应用空间广泛,但短期内它仍面对几个关键技术瓶颈。 1)回答的真实性 ChatGPR 可 能 会 写 出 看 似 合 理 但 不 正 确 的 答 案 。 这 主 要 是 因 为 模 型 进 行 强 化 训 练 (Reinforced Learning)时,缺乏真实信息来源。另外,为了提高模型的严谨性,模型会 拒绝回复部分它能正确回答的问题。同时,监督训练会误导模型,由于模型产生的答案是 基于模型的认知而不是人类标注师的认知。 2)数据量级和算力门槛影响模型的实时性 ChatGPT 学习的数据库停留在 2021 年, 由于模型的数据量级大(GPT-3 1750 亿参数, 使用 800GB 数据进行训练),加入标注数据训练让实时数据的引入非常困难,重新预训练 模型的成本也高(单次几百万美元以上),导致 ChatGPT 对于 2021 年后发生的事情的了 解有限。 3)回答内容存在偏见或有害指令 ChatGPT 使用了“人类反馈强化学习”(RLHF)的训练方法。首先,预训练的模型在少量已 标注的数据上进行调优,随后让预训练好的模型(SFT)针对新问题列表生成若干条回答, 并让人类标注师对这些回答进行投票,以创建一个由比较数据组成的新数据集。在此数据 集上训练新模型(Reward Model, RM)。RM 模型用于进一步调优和改进 SFT,并将最后 两个步骤反复迭代以获得最终的模型。 这个方法有明显的局限性,用于 fine-tuning 模型的数据会受到人工标注者的偏好和偏差影 响,标注者通常对模型输出的排名持不同意见,RLHF 的方法假设所有人都有相同的价值 观,这导致 ChatGPT 导出的内容可能存在偏见。 图 7:ChatGPT 基于人类反馈对语言模型进行强化学习 资料来源:OpenAI, 招银国际环球市场 敬请参阅尾页之免责声明 6
7 .2023 年 2 月 10 日 ChatGPT 的底层技术发展演进 从小模型到大模型的兴起 AI 模型最初是针对特定应用场景需求进行训练(即小模型)。小模型的通用性差,换到另 一个应用场景中可能并不适用,需要重新训练,这牵涉到很多调参、调优的工作及成本。 同时,由于模型训练需要大规模的标注数据,在某些应用场景的数据量少,训练出来的模 型精度不理想的情况,这使得 AI 研发成本高,效率低的情况。 过去 5 年,随着数据,算力及算法的提升,AI 技术也有了变化,从过去的小模型到大模型 的兴起。大模型(也称为基础模型 Foundation Models)是在大规模无标注数据上进行训练, 学习出特征和规则。大模型泛化能力强,美国 OpenAI, 谷歌,微软,Facebook 的机构过去 几年发布了千亿或万亿参数量的大模型,这些大模型主要是在自然语言领域(NLP),包 括 ChatGPT 背后的 GPT-3,Switch Transformer,BERT 等。 基于大模型进行应用开发,将大模型进行微调(在下游特定任务上的小规模有标注数据进 行二次训练),或者不进行微调,可以完成多个应用场景的任务。这有效降低 AI 应用研发 门槛,也能解决在应用场景数据量少,模型精度低的问题。 在图 8 ,我们列出了过去 5 年中美主要大模型及其参数量的规模,在发布时间的差距上, 我们可以看到中国的大模型是集中在 2021 年到 2022 年之间,而美国同等参数量级的模型 比中国领先 1-2 年。另外,我们看到模型的规模也呈现指数级扩张。 但需要注意的是,模型的参数规模不一定是越大越好,大模型的可解析性和可控性比较薄 弱,复杂的模型使他们比普通的神经网络更难以理解,在检测和减轻这些 blackbox 模型的 偏差会变得更加困难。 图 8:国内外企业发布的超大深度学习模型 # of parameters (mn) 1,000,000,000 BAAI, Alibaba: BaGuaLu 100,000,000 10,000,000 Alibaba: M6 Google: Switch 1,000,000 Transformer BAAI: CPM-2 Inspur: Yuan 1.0 OpenAI: GPT-3 Huawei: PanGu-α 100,000 CASIA: Zidongtaichu Microsoft: T-NLG BAAI: WuDao-WenHui Baidu: Plato-XL 10,000 Google: T5 Nvdia: Megatron-LM Meta: Blender Baidu: ERNIE 3.0 BAAI: CPM OpenAI: GPT-2 1,000 Meta: RoBERTa Google: BERT OpenAI: GPT DeepMind: BigGAN-deep 100 10 1 Sep-17 Apr-18 Oct-18 May-19 Dec-19 Jun-20 Jan-21 Jul-21 Feb-22 Aug-22 Foundation models 资料来源:Github,招银国际环球市场 敬请参阅尾页之免责声明 7
8 .2023 年 2 月 10 日 自然语言处理(NLP)大模型 自然语言处理(NLP)主要通过学习通用语言,使得模型具备语言理解和生成能力。在 AI 的感知层(识别能力),目前机器在语音识别(Speech Recognition)的水平基本达到甚 至超过了人类的水平。然而,机器在处理自然语言时还是非常困难,主要是因为自然语言 具有高度的抽象性,语义组合性,理解语言需要背景知识和推理能力。 在 2018 年以来,以 BERT 和 GPT 为代表的语言大模型,弥补了自然语言处理标注数据的 缺点,促进了 NLP 技术的发展。从技术的角度,这些大模型的训练,透过事先遮住一些文 本片段,让 AI 模型通过自监督学习,通过海量语料库的预训练,逐步掌握上下文语境,把 这些被遮住的片段,尽可能合乎逻辑的方式填上去。 现阶段只有微软和谷歌正式发布了基于 NLP 大模型的可交互式应用,暂时没有办法评判每 家公司大模型在实际产品中的表现。我们尝试比对国内及国外比较领先的 AI 公司在 NLP 领 域的专利数,根据 WIPO 国际专利分类,我们参考了 G06F17/20 项(Handling natural language data),国内比较领先的是互联网企业,前三分别是腾讯,百度和阿里巴巴(专 利数在 600 个以上),而专注于语音方面的 AI 企业科大讯飞只有 100 多个专利。国内 AI 企业和国际巨头相比,在 NLP 领域的专利数量差距还是比较明显,像微软及谷歌等,他们 在 NLP 的专利数已经在几千个的量级。 图 9:NLP 领域专利数量比较 Sensetime AISpeech Bytedance iFlytek Huawei Alibaba Baidu Tencent Facebook/Meta Amazon Google Microsoft 0 1,000 2,000 3,000 4,000 5,000 6,000 7,000 Microsoft Google Amazon Facebook/Meta Tencent Baidu Alibaba Huawei iFlytek Bytedance AISpeech Sensetime 资料来源:WIPO, 招银国际环球市场 *比较 G06F17/20 项 计算机视觉(CV)大模型 在早期的计算机领域(CV),模型的训练需要透过提取特征工程。视觉大模型是通过学习 大量的图像和视频数据,形成具备视觉通用能力。相较于上千亿参数的 NLP 模型相比,CV 模型规模要小两三个数量及,目前 CV 大模型的发展还是存在一些挑战,包括 1)在 CV 领 域可用于训练的有效数据比 NLP 领域有不少差距,2)CV 领域的学习方法还需要突破,3) 不同的视觉应用仍需要依赖于不同的模型,如何建立通用的视觉模型还是未知,4)供训练 的图像尺寸越来越大,较小的模型也可能有很大的计算量。 敬请参阅尾页之免责声明 8
9 .2023 年 2 月 10 日 现阶段比较有名的 CV 大模型包括微软的 swin-transformer 系列,谷歌的 ViT 系列以及有 150 亿参量的 V-MOE 模型。 国内方面,截止 2021 年,商汤训练了 300 亿参数的 CV 模 型,2022 年,华为也发布了 30 亿参数的盘古系列 CV 模型。 图 10:CV 大模型 资料来源:”On the Opportunities and Risks of Foundation Models”, 招银国际环球市场 多模态模型 多模态机器学习(MultiModal Machine Learning, MMML)是指通过机器学习的方法实现处 理,理解及融合多源模态信息的能力,模态是指某种类型的信息,例如文本、图像、视频、 音频等,目前比较热门的研究方向是文本-图像的模型及应用,这里面 比较有名的 是 OpenAI 发布的 CLIP 和 DALL·E。 CLIP(Constrastive Language-Image Pre-training)是一个基于对比图片-文本学习的跨模 态预训练模型,通过自然语言的监督学习来有效理解视觉概念,用户只需要提供要识别的 视觉类别标签,CLIP 就能完成视觉分类任务。 基于 CLIP 模型技术,OpenAI 在 2022 发布 DALL·E 2,它是一个 AI 程序,可以通过文本 描述生成图像。例如,当文本提示为“生成牛油果形状的躺椅”,DALL·E 可以理解牛油果及 躺椅的概念,并生成各种牛油果形状的,绿色的躺椅。在输出图像是,DALL·E 采用 CLIP 进行排序,从中选取最优结果。 图 11:DALL·E 演示 资料来源:OpenAI,招银国际环球市场 敬请参阅尾页之免责声明 9
10 .2023 年 2 月 10 日 算力层:大模型驱动 AI/内存芯片需求全面加速 ChatGPT 运行需具备三大条件:数据上,获取训练数据,然后进行清洗和分离,获得不同 用于训练和测试调优的数据集;算法上,在基础模型上大规模预训练需要大量算力,获取 基于模型调优后不断解锁和进化;算力是核心基础和关键所在,数据获取和模型调优等需 大量算力支持;而大算力需更多高端、通用或专用算力芯片和 AI 芯片去支撑算法运行。 随着 AIGC 典型应用 ChatGPT 发展推动企业和个人服务多模型和技术向 AI 方向构建,同 时还将驱动底层领域包括半导体、HPC 和云计算等的协同发展,预计未来对 AI 和内存芯片 需求将快速提升。我们建议关注 AI 芯片相关标的:1)GPU:海外包括英特尔、英伟达和 AMD;国内包括景嘉微、寒武纪、海光信息、龙芯中科和航锦科技;2)FPGA:海外包括 英特尔、AMD;国内包括紫光国微、复旦微电和安路科技;3)ASIC:海外包括英伟达、 谷歌和英特尔;国内包括百度和寒武纪。内存芯片:建议关注海外标的包括三星、美光和 SK 海力士;国内关注兆易创新。 AI 芯片 AI 芯片能为人工智能应用提供所需的基础算力;按技术架构主要分为 GPU、FPGA和 ASIC。 ChatGPT 有着大量复杂计算需求的 AI 模型, AI 芯片专门用于处理人工智能应用中的大量 计算任务,是不可或缺的底层硬件。随着 AI 技术快速发展,AI 应用场景扩大至智能制造、 家居、教育、医疗和金融等领域;而智能产品种类不断丰富,包括 ChatGPT 等 AIGC 产品 持续升级对芯片算力提出更高要求,AI 芯片算力和需求旺盛增长。据 Frost&Sullivan 预计, 2022-2026 年全球 AI 芯片市场规模将以 26.3%复合增速增长。 从基础预生成 AI 到机器学习,最终达到深度学习,主要依赖于审阅庞大的数据集合、处理 数据、生成算法模型、训练算法模型的能力,而 AI 芯片就是从处理数据到终端赋能的算力 基础。AI 芯片主要分为三种,分别是 GPU, FPGA 与 ASIC 芯片。不同种类别的 AI 计算芯 片有各自突出的优势和适用的领域,贯穿 AI 训练与推理阶段。目前 CPU 在人工智能领域 中的应用有限,主要受限于 CPU 在 AI 训练方面的计算能力不足。 图 12:不同类型的人工智能计算芯片 CPU GPU FPGA ASIC 定义 中央处理器 图像处理器 现场可编程逻辑门阵列 专用处理器 算力与能效 算力最低、能效比差 算力高、能效比中等 算力中,能效比优秀 算力高,能效比优秀 上市速度 快,产品成熟 快,产品成熟 快 慢、开发周期长 成本 用于数据处理时,单价 用于数据处理时,单价成本高 较低的试错成本 成本高,可复制,量产规模生 成本最高 产后成本可有效降低 性能 最通用 数据处理通用性强 数据处理能力较强、专用 AI 算力最强,最专用 适用场景 广泛应用于各种领域 广泛应用于各种图形处理,数 适用成本要求较低的场景, 主要满足场景单一的消费电子 值模拟,机器学习算法领域 如军事、实验室、科研等 等高算力需求领域 芯片 英伟达 Telsa, Titan, Xavier 公司 英特尔 Xeon Gaudi, Greco Arria , Stratix NNP, NCS2 谷歌 Cloud TPU, Edge TPU AMD Ryzen Addebaran Versal, Alveo 莱迪思 Lower Power 资料来源:公司,招银国际环球市场 敬请参阅尾页之免责声明 10
11 .2023 年 2 月 10 日 图 13:人工智能学习与涉及芯片类型 资料来源:OpenAI, 招银国际环球市场 1)GPU(图形处理器) GPU 作为显示芯片是可在个人电脑、工作站、游戏机和智能手机/平板电脑上做图像和图像 相关运算工作的微处理器。随着互联网用户和网络应用兴起,数据体量逐渐庞大,数据中 心对计算需求快速增加,GPU 凭借其相对通用灵活和适应并行计算等特性成为主要选择, GPU 也从最初专用于图像处理制作后逐渐应用于计算,是核心计算资源基础。 目前来看,GPU 仍然是 AI 应用的主导芯片,主要因为它具有强大的计算能力和高通用适用 性,广泛应用于各种图形处理、数值模拟及人工智能算法领域。较低的开发成本也时期能 够快速在各个垂直下游领域被广泛应用,加速优化拓展。 ChatGPT 作为有着大量复杂计算需求的 AI 模型,GPU 芯片成为能帮助其完成计算任务的 关键硬件之一;随着深度学习技术发展,GPU 成为 AI 算法训练中重要硬件组成部分。同 时,随着云计算技术发展,云端对 GPU 算力要求在不断提升。据机构 JPR 预测显示, 2022-2026 年全球 GPU 出货量将以 6.3%复合增速增长;预计 2027 年行业市场规模将超 320 亿美元。 图 14:全球 GPU 芯片行业市场规模预测 图 15:中国 GPU 芯片行业市场规模预测 资料来源:JPR,前瞻产业研究院, 招银国际环球市场预测 资料来源:Huaon, 招银国际环球市场预测 全球 GPU 芯片行业竞争格局中英特尔占主导地位,但在独立 GPU 领域,英伟达高端 GPU 占据较大份额(超过 70%)。英伟达 GPU 因其高性能和对 CUDA 的支持而广泛应用于 AI 和机器学习领域(CUDA 是 NVIDIA 的并行计算平台和编程模型)。因此,OpenAI 主要使 用 NVIDIA GPU(图形处理单元)来训练和运行其 AI 模型,如 GPT-3 和 ChatGPT。据公 开数据显示,ChatGPT 已导入至少 1 万个英伟达高端 GPU。 敬请参阅尾页之免责声明 11
12 .2023 年 2 月 10 日 图 16:1Q14-3Q22 全球电脑显卡市场份额变化 图 17:全球独立 GPU 市场份额及出货量 资料来源:JPR, 招银国际环球市场预测 资料来源:JPR, 招银国际环球市场预测 国内 GPU 主要上市公司中,景嘉微通过自主研发 GPU 并规模化商用,是国内显示控制市 场龙头企业。此外,海光信息、寒武纪等公司均有布局 GPU 产品。受美国对中国 GPU 芯 片出口管制影响,预计国产 GPU 芯片替代将快速推进。 2)FPGA(现场可编程门阵列) FPGA 是支持 AI 算力芯片的更优解,优点主要在于低延迟、优秀的能效比、较短的开发周 期以及高度可编程能力,可以供给不同垂直行业使用。FPGA 是一种硬件可重构的集成电 路芯片,通过在硅片上预先设计实现具有可编程特性,可通过软件重新配置芯片内部的资 源来实现不同功能,广泛应用于数据中心、航空航天工程、人工智能、工业、物联网以及 汽车等领域。FPGA 拥有软件的可编程性和灵活性、兼具硬件的并行性和低延时性,相较 于 ASIC、GPU 等处理器更为灵活,具备上市周期和成本优势。在 5G 通信、人工智能等 迭代升级周期频繁、技术不确定性较大的领域,FPGA 是较为理想的解决方案。 随着全球新一代通信设备部署以及人工智能与自动驾驶技术等新兴市场领域需求的不断增 长,前瞻产业研究院预计全球 FPGA 市场规模将从 2021 年的 82.9 亿美元增长至 2025 年 的 125.2 亿美元,年均复合增长率约为 10.8%,中国 FPGA 市场规模快速增长,预计 2021- 2025 年规模复合增速 17.1%。 图 18:全球 FPGA 芯片市场规模预测 图 19:中国 FPGA 芯片市场规模预测 资料来源:前瞻产业研究院, 招银国际环球市场预测 资料来源:Huaon, 招银国际环球市场预测 敬请参阅尾页之免责声明 12
13 .2023 年 2 月 10 日 全球 FPGA 市场主要被赛灵思和 Altera 占据,目前市占率分别为 52%和 35%;其次为 Lattice 和 Microsemi,份额均为 5%。中国 FPGA 厂商中紫光国微、复旦微电和安路科技在 2021 年市占率超过 15%。受益于国产化加速推进,中国 FPGA 厂商将拥有巨大成长空间。 图 20:2021 年全球 FPGA 市场竞争格局 图 21:2021 中国 FPGA 市场竞争格局 资料来源:ASKCI, 招银国际环球市场预测 资料来源:安路科技公司公告, 招银国际环球市场预测 3)ASIC(专用集成电路) ASIC 是为特定用途而定制的集成电路,具有高性能、低能耗的特点,专用化程度最高,其 特点同时适合 AI 训练和推理阶段的使用。ASIC 芯片包括 DPU 和 NPU 类别,其中,DPU 主要承担网络、存储和安全的加速处理任务,旨在满足网络侧专用计算需求,适用于服务 器量多、对数据传输速率要求严苛的场景。ASIC 应用领域广泛,包括医疗、工业、军事、 航空等。其中虚拟币是主要应用领域之一,因相对 GPU、FPGA,ASIC 能效更高。 目前 ASIC 渗透率依然较低,主要由于其较高的研发成本与研发壁垒,因此市场份额显著小 于 GPU。随着人工智能行业愈加成熟,蓬勃发展的下游应用对于上游研发成本的优化力不 断增高,ASIC 芯片依赖于它的卓越性能及低功耗,将成为人工智能技术的首选。根据贝哲 斯咨询预测,到 2027 年,全球 ASIC 市场规模预计将达 1677.49 亿元,2021-2027 年均复 合增长率为 8.9%。 图 22:全球 ASIC 芯片市场规模预测 资料来源:贝哲咨询, 招银国际环球市场预测 敬请参阅尾页之免责声明 13
14 .2023 年 2 月 10 日 全球 ASIC 主要竞争者包括英伟达、谷歌和英特尔。其中:1)英伟达:在 2020 年推出 BlueField-2 DPU,将其定义为继 CPU 和 GPU 之后“第三颗主力芯片”;2)谷歌:在 I/O 2022 活动中发布其新一代张量处理器 TPU v4 集群,新的算力集群被称为 Pod,包含 4096 个 v4 芯片,可提供超过 1 exaflops 的浮点性能,公司将在位于俄克拉荷马州的数据中心部 署 8 个 TPU v4 集群,合计实现约 9 exaflops 的性能;3)英特尔:在英特尔 FPGA 技术大 会上,英特尔发布了全新可定制解决方案英特尔 eASIC N5X,帮助加速 5G、人工智能、 云端与边缘工作负载的应用性能。英特尔 eASIC N5X 通过 FPGA 中的嵌入式硬件处理器帮 助客户将定制逻辑与设计迁移到结构化 ASIC 中,带来更低的单位成本,更快性能和更低功 耗等好处。目前英伟达的定制化 ASIC 芯片价格为 2.48 美元/小时,而最初的设计者谷歌的 定制化 ASIC 芯片价格为 8 美元/小时。 国内主流的 ASIC 上市公司包括百度和寒武纪:1) 百度(9888 HK):百度从 2011 年起布 局 AI 加速领域,昆仑芯团队深耕 FPGA 到 ASIC 芯片已 10 余年,在体系结构、芯片实现、 软件系统和场景应用均有深厚积累。2) 寒武纪(688256 CH):以深耕 ASIC 为主,其思 元 270-S4 型号芯片专注于为数据中心提供服务。 内存芯片 高性能计算芯片需要搭配的 DRAM 内存数量大幅增加,DRAM 特征是读写速度快、延迟低, 常用于计算系统的运行内存。DRAM 集成度高、功耗低、存取速度慢。从存储能力来看, DRAM 所能提供的存储容量更大,访问时间较长。随着 ChatGPT 采用高性能计算芯片提升 算力,我们认为需要搭配的 DRAM 内存数量将大幅增加。 全球 DRAM 市场高度集中,三星、美光、SK 海力士 DRAM 出货量在 3Q22 合计占比约 96%。受行业周期性低迷的影响,三星电子、SK 海力士和美光正扎堆减产、应对库存问题、 节约资本开支,并推迟先进技术的进展,以应对存储器需求的疲软态势。据集邦咨询研究, 由于消费需求疲弱,存储器卖方库存压力持续,仅三星(Samsung)在竞价策略下库存略降。 图 23:3Q22 全球 DRAM 出货量市占率 4.1% 28.8% 40.7% 26.4% 三星 美光 SK海力士 其他 资料来源:Omdia, 招银国际环球市场预测 兆易创新 (603986 CH)为国内 DRAM 龙头企业,与长鑫密切合作,推动自有品牌 DRAM 多 行业应用,实现了从设计、流片,到封测、验证的全国产化,助力国产自主供应生态圈的 发展构建,该产品主要面向消费类、工业控制类及汽车类等市场领域。公司与长鑫存储的 紧密合作关系,为公司 DRAM 产品提供稳定产能保障。同时,依托于多年积累的、完善的 销售网络和技术团队,公司能够为客户提供快速的本地化服务响应和技术支持。 敬请参阅尾页之免责声明 14
15 .2023 年 2 月 10 日 应用层:AIGC 万亿市场可期,大模型+内容生态为关键 进入“数智化时代”,看好 ChatGPT/AIGC 应用场景持续渗透及商业化加速 (包括搜索引擎、 智能客服、教育培训、金融等),助力行业降本增效的同时,开拓创新变现增量。 场景应用:搜索+智能客服先行,内容创作+文娱生活加速落地,长期 B 端 产业升级可期 我们看好 ChatGPT 在搜索引擎的协同和能力加强,多项回复展示更好满足用户信息获取, 智能创作、编程、分析等能力助于提高搜素转化率。考虑当前 ChatGPT 信息基于离线非实 时数据库、训练模型下答案非正确、成本过高,我们预计 ChatGPT 较难取代搜索引擎,更 多体现在赋能优化。电商领域,ChatGPT 有望在智能客服领域通过大模型通用智能能力完 善人机对话丝滑度和专业答疑。期待 ChatGPT 未来在代码机器人、翻译、文学创作、媒体、 教育培训、家庭陪护、金融等领域加速落地。文字之外,AIGC 也将在内容创作、数字经济、 产业升级层面带来变革,中期电商、传媒、娱乐、影视等领域加速渗透机会显现,长期看 好 AIGC 推动 B 段医疗、工业、金融等产业升级(例如:合成数据)。 图 24:AIGC 应用场景 AIGC应用场景:前期内容创作+文娱生活场景导向,长期看好B端产业机会 娱乐 传媒 影视 电商 B端产业机会 全民娱乐 采集 前期制作 商品展示 教育 金融 • 人脸美妆/融合 • 人脸美妆/融合 • 合成历史人物 • 营销视频合成 • 黑白图像上色 • 黑白图像上色 • 智能商详 • 视频虚拟教师 • 智能金融客服 • 采访助手 • 图像风格转换 • 图像风格转换 • 商品3D模型生成 • 线上课堂音视频处 • VR金融场景构建 • 人像属性变换 • 人像属性变换 理 社交互动 编辑 中期拍摄 主播打造 工业 医疗 • 写稿机器人 • 数字复活已故演员 • 医学图像处理 • • 辅助工程设计 • 虚拟歌姬 • 智能视频拆条视频 高难度动作合成 • 智能病例录入 • 品牌虚拟主播 • 加速数字孪生系统 • 虚拟网红 锦集 • 演员角色年龄跨越 • 合成肢体投影 构建 • 视频字幕生成 • 虚拟物理场景合成 • 合成医护陪伴 偶像养成 播报 后期制作 交易场景 • 替换“劣迹艺人” • AI主播 • 多语言译制片音画 • 用户数字化身 • 虚拟商城构建 • 智能播报 同步 • 影视作品修复影视 预告片生成 • 影视内容2D转3D 资料来源: 中国信息通信研究院, 京东探索研究院,招银国际环球市场整理 敬请参阅尾页之免责声明 15
16 .2023 年 2 月 10 日 变现空间: AIGC 万亿市场可期,订阅付费加速商业化,MaaS 探索长期增 长点 下一代互联网业态对内容产出效率、内容消费的蓬勃需求,将驱动 AIGC 快速发展。结合 Gartner 及 Acumen Research and Consulting 预测,2025 年 AIGC 渗透率将达 10%,至 2030 年 AIGC 市场规模达 1108 亿美元 (对应 2021-2030 年 CAGR 达 34%)。其中,对话式 AI 预计 2030 年市场规模达 34 亿美元 (vs. 2021 年 5.2 亿美元)。当前 AIGC 企业变现模式 主要为:订阅付费(每月订阅)、按量收费(数据请求量、计算量、图片张数、模型训练次数 等),未来 MaaS(模型即服务)有望复制 SaaS 企服路线迎来需求爆发奇点 (海外 Hugging Face 已成型)。 图 25:全球 AIGC 市场规模 图 26:对话式 AI 市场规模 1200 40.0 亿美元 亿美元 35.0 1000 30.0 34% CAGR 24% CAGR 800 25.0 600 20.0 1108 34.1 15.0 400 10.0 200 5.0 5.2 79 0 0.0 2021 2030E 2021 2030E 资料来源:Acumen Research and Consulting,招银国际环球市场 资料来源:Acumen Research and Consulting,招银国际环球市场 受益标的:在 ChatGPT/AIGC 应用层面,建议重点关注拥有海量数据、大模型能力及 AI 内 容创作产品丰富 (文/音/图/视)的头部平台,包括 OpenAI、微软、谷歌、Meta、百度、腾讯、 阿里、字节;可同时关注近期推出类 ChatGPT 服务或泛 AI 产品的垂类腰部平台,如网易、 知乎、阅文、昆仑万维等。我们看好百度在 ChatGPU 及 AIGC 的全栈技术储备、搜索引擎 协同及产品管线,受益于:1)文心一言待推出,数字人+智能创作应用矩阵丰富;2)文 心大模型技术支持及海量数字资产优势 (语料库、参数量大)。 敬请参阅尾页之免责声明 16
17 .2023 年 2 月 10 日 图 27:ChatGPT/AIGC 相关受益标的(应用及场景方向) 公司 股票代码 ChatGPT/AIGC 相关业务情况 1)ChatGPT 聊天机器人;2)全新 Bing 搜索服务(新增一个扩展聊天框,在回答问题的同时帮 微软 MSFT US 助即时生成个性化分析和建议);3)Edge 浏览器(是新增聊天和内容创作两项功能) 1)Bard 聊天机器人(基于 LaMDA 大模型);2)AI 生成音频(Magenta);3)AI 生成图像 谷歌 GOOGL US (Imagen, Parti, NeRF, NeRV);4)AI 生成视频(Imagen Video,Phenaki) Meta META US 1)AI 生成文字(VX2Text);2)AI 图文:Make a Scene;3)AI 视频制作:Make A Video 1)深度学习开源框架,飞浆 Paddle;2)全栈 AI 基础设施,百度 AI 大底座;3)AI 应用场景全 百度 BIDU US 覆盖大模型,文心大模型(NLP、CV、跨模态、生物计算及各行业大模型)。 1)基础设施:通义大模型;2)类 ChatGPT 产品研发内测中;3)AIGC 应用于智能客服、视觉生 阿里巴巴 BABA US 成、在线设计、在线试穿、数字人等 1)HunYuan-NLP-1T (混元 AI 大模型,涵盖 NLP、CV、多模态、文生图等大模型);2)AI 生成 腾讯 700 HK 文字(梦幻写手 Dreamwriter);3)AI 生成游戏(绝悟 AI);4)AI 绘画 (腾讯 QQ 小世界 AI 画匠); 5)数字人(AI Lab 数字人 PaaS 方案,创建的数字人“艾灵”) 等 1)网易有道未来或将推出 ChatGPT 同源技术产品,应用场景围绕在线教育;此前已应用 AI 口语和 网易 NTES US 作文批改。2)AI 生成声音:有灵、网易天音;3)数字人 知乎 ZH US 作为中文最大的问答社区,拥有海量可训练素材 阅文 772 HK 联合微软(亚洲)互联网工程学院开启 AI 赋能网络文学(NLP) 美图 1357 HK 美图秀秀 AI 绘画功能(CV) 万兴科技 300624 CH Filmora、万兴喵影、Pixso(CV) 拓尔思 300229 CH 1)TRS 小思智能回答机器人;2)语义智能技术平台“智拓”( NLP) 1)多模态内容生成功能;2)“昆仑天工”旗下模型(包括天工巧绘 Sky Paint、天工乐府 Sky 昆仑万维 300418 CH Music、天工妙笔 Sky Text、天工智码 SkyCode) 视觉中国 000681 CH 发售数轮 AIGC 数字藏品(与百度文心一格达成战略合作协议,NLP、CV) 1)Al 文字辅助创作功能;2)AI 辅助绘画功能已推出;3)“AI 主播”和复活 3D 模型虚拟数字人 中文在线 300364 CH (NLP、CV) 汉仪股份 301270 CH 字体生成,AI 造字 1)多模态智能算法等;2)升级发布“Meta Surfing-元享智能云平台”(在原有功能基础上纳入 天娱数科 002354 CH AIGC 功能模块) 风语筑 603466 CH 1)虚拟展厅;2)虚拟数字人;3)虚拟场景以及数字艺术创作领域(CV、数字人等) 资料来源: 公司资料, 招银国际环球市场整理 敬请参阅尾页之免责声明 17
18 .2023 年 2 月 10 日 中美对比:美国底层技术领先,中国内容场景多点开花 中美引领全球预训练大模型发展,美国底层技术领先 大模型底层创新始于美国:Google 在 2017 年首次提出 NLP 模型 Transformer 及 OpenAI 的 GPT 3.0;中国于 2021 年后加速追赶,重点发力 CV 大模型和多模态融合。 当前中美两国引领全球预训练大模型发展。据国内 OpenBMB 开源社区统计,目前,在全 球超千亿参数大模型中,中国企业或机构贡献了 1/3,美国贡献了 1/2,世界其他国家或组 织贡献了剩下的 1/6。截至 2022 年 10 月,在拥有大模型数量及参数量前十名的组织中, 中/美分别占据 4/6 席。 我们认为,目前美国 ChatGPT 的技术领先国内公司 2-3 年,其中 2020 年 OpenAI 发布 GPT-3.0 后中美差距有所拉大。中美技术差距并非由于中国缺乏大数据和参数量(百度文 心大模型参数量达 2600 亿,vs. ChatGPT 1750 亿),而在于: 1) 中国原创模型匮乏,算法 深刻见解待提升;2) 2022 年 8 月美国限制部分高端 GPU 出口中国,一定程度影响模型训 练速度。随着中国公司在算法 AI 的持续投入、巨头积极布局,底层技术处于跟随和追赶态 势,部分算力约束通过国产 GPU/大规模分布式 CPU 替代。看好中国强大的基建能力、用 户规模及大数据优势,有望依托大模型在 AIGC 应用落地、产业升级爆发巨大增长潜力。 图 28:全球千亿参数模型贡献比例 图 29:全球大模型数量及参数量 TOP10 分布 7 6 其他 5 中国企业 33% 4 3 6 2 4 美国企业 1 50% 0 中国 美国 资料来源:OpenBMB,招银国际环球市场 资料来源: OpenBMB (2022.10),招银国际环球市场 敬请参阅尾页之免责声明 18
19 .2023 年 2 月 10 日 技术面:数据及大模型参数量差距较小,算力和模型迭代仍需精进 美国凭借在模型迭代和算力上的先发优势,聚焦大模型 API 的基础设施层开发,带动信息 产业和科学行业发展,并加速商业化。中国公司在 AI 数据及大模型参数量层面与美国差距 较小,但模型迭代和训练仍有较大提升空间,大部分平台更加聚焦 AIGC 内容和应用端。 美国主要大模型包括 OpenAI 的 GPT-3、Anthropic 的 Claude、英伟达与微软的 Megatron Turing-NLG 以及 Meta 的 OPT 等。其中,OpenAI 预计在今年年中或者下半年上线 GPT- 4,参数量将达到万亿级。Google 把 GPT 系列模型作为红线,并全力投入 LLM(大语言模 型)模型的构建。 中国大模型主要包括百度文心、华为盘古、阿里通义、腾讯混云以及商汤的视觉模型等。 百度推出文心大模型,基本实现跨模态和多下游多领域的应用,且预计在今年 3 月上线文 心一言(ERNIE Bot),从参数量来看可与 ChatGPT 媲美。华为通过模型泛化,解决传统 AI 作坊式开放模式下不能解决的 AI 规模化和产业化难题。 整体来看,美国在模型上仍具有先发优势,源于长时间的技术迭代和数据累积。从 2018 年 发布 GPT 1.0,到 2021 年发布 GPT-3.5 和 Instruct GPT,OpenAI 已形成了一系列海量数 据积累和训练模型,或将于今年年中/下半年发布 GPT-4 版本(万亿级参数量)。虽然当前部 分中国大模型参数量能达到千亿级乃至万亿级,但数据质量及训练模型尚需时间精进。 图 30:美国大模型类型及参数量 预训练模型 应用 参数量 领域 BERT 语言理解和生成 4810 亿 NLP LaMDA 对话体统 1370 亿 NLP 谷歌 PaLM 语言理解与生成、推理、代码生成 5400 亿 NLP Lmagen 语言理解和图像生成 110 亿 多模态 Parti 语言理解和图像生成 200 亿 多模态 Florence 视觉识别 6.4 亿 CV 微软 Turing-NLG 语言理解和生成 170 亿 NLP OPT-175B 语言模型 1750 亿 NLP Meta M2M-100 100 种语言互译 150 亿 NLP Gato 多面手的智能体 12 亿 多模态 Deep Mind Gopher 语言理解与生成、推理、代码生成 2800 亿 NLP AlphaCode 代码生成 414 亿 NLP GPT3 语言理解与生成、推理等 1750 亿 NLP CLIP&DALL-E 图像生成、跨模态检索 120 亿 多模态 Open AI Codex 代码生成 120 亿 NLP ChatGPT 语言理解与生成、推理等 1750 亿 NLP Anthropic AnthropicLM v4-s3 语言理解与生成、推理等 520 亿 NLP Claude 语言理解与生成、推理等 520 亿 NLP 英伟达 Megatron-Turing NLG 语言理解与生成、推理 5300 亿 NLP Stability AI Stable Diffusion 语言理解和图像生成 多模态 资料来源:腾讯,网上公开信息整理,招银国际环球市场 敬请参阅尾页之免责声明 19
20 .2023 年 2 月 10 日 图 31:中国大模型类型及参数 预训练模型 应用 参数量 领域 百度·文心 文本理解与创作 2600 亿 NLP VIMER-UFO 视觉识别 170 亿 CV 百度(文心) ERNIE-ViLG 2.0 语言理解和图像生成 AI 作图全球最大(目前) 多模态 Helix 生物计算 科学计算 NLP 大模型 文本理解与创作 千亿 NLP CV 大模型 视觉识别 30 亿 CV 华为(盘古) 多模态大模型 语言理解和图像生成 千亿 多模态 科学计算大模型 气象预测 科学计算 通义-M6 语言理解、图像生成和制造业 十万亿 多模态 阿里巴巴 通义-AliceMind 文本理解与创作 270 亿 NLP 通义-视觉 视觉识别 CV 混元 AI 大模型 语言理解和图像生成(理解广告内容) 千亿 多模态 腾讯 精排大模型 精准匹配广告和人群 千亿 科学计算 商汤科技 视觉模型 视觉识别 300 亿 CV 资料来源:网上公开信息整理,招银国际环球市场 应用面:美国商业化加速、赋能 2B;中国变现早期,侧重生活互娱 C 端场 景 美国企业 AIGC 商业化进程加速,且服务和收费方式日渐丰富。例如,Open AI 今年预计实 现 2 亿美元收入(Fortune 报道), 且宣布推出 ChatGPT Plus 付费订阅套餐(20 美元/月)。订 阅用户可在免费服务基础上享受高峰时段免排队、快速响应、优先获取新功能等额外权益。 此外,DALL-E 和 Stable Diffusion 等其他主流应用亦开启商业变现,企业根据使用量、内 容产出量、提供服务以及使用属性等方面进行收费。美国 AIGC 场景落地侧重 2B 产业升级 (如:合成数据等)。中国的商业化进程尚在早期,大部分产品处于免费试用阶段或根据 使用量收费,且主要集中在语音、写作、数字人等 2C 场景应用。在 2B 方面,头部公司在 金融、物流、政务层面亦在延伸。 图 32:中美大模型部分应用对比 公司 模型 领域 场景/效果 可为多项选择提供数据集,并对医疗专业人员和非专业人士提出的问题做出更详细的回 PaLM 医疗 答。 根据一组医生的数据,92.6% 的 Med-PaLM 反馈与临床医生生成的答案 (92.9%) 相 谷歌 当。 BERT 信息 BERT 可以从大量非结构化数据中提取信息,可用于为任何类型的图书馆创建搜索界面。 模型可以帮助用户对文档和邮件进行摘要化处理,同时能够应用在 Office 系列软件中, Turing-NLG 信息 提供写作帮助和疑难解答。为下一代聊天机器人和数字助理铺平了道路,有望被用于客 服、销售等方向。 微软 通过整合图像-文本数据的通用视觉语言表示能力,Florence 可以轻松适用于各种计算机 Florence 信息 视觉任务,如分类、目标检测、VQA、看图说话、视频检索和动作识别,在多种类型的迁 移学习中均表现出色。 测试数据显示,使用电影频道-百度·文心大模型每天可修复视频 28.5 万帧,解决了绝大部 文心大模型 电影 分画面的修复问题。即便是需要进一步精修,修复速度也能提升 3-4 倍。 百度 金融文本命名实体识别模型的 F1 值提升约 3%,有效提升授信报告的处理效率;在金融 文心大模型 金融 语义相似度,金融事件主体抽取等一系列公开数据集上相对通用大模型取得显著提升 。 敬请参阅尾页之免责声明 20
21 .2023 年 2 月 10 日 共建模型的智能客服知识库扩充任务人工评估可利用率相对基线提升 24.37%,能大幅提 高问答的泛化水平,提高客服系统的智能化体验; 除此以外,在车载语音系统短答案生 文心大模型 汽车 成、汽车领域知识库构建等生成任务上的效果均有 20%-35%的提升,可辐射至多个汽车 行业场景。 在金融、电商,政务领域实现精准舆情分析、企业运营软件分析。关键技术:文档信息抽 舆情 取、情感分类、文档自动摘要等。 NLP 大模型 取代目前逐渐上升的人力成本和降低成功率的智能客户与营销系统。关键技术:文本匹 营销 配,问答和对话系统、意图识别等。 进行无人机智能巡检,并解决巡检系统中数据标注工作量大和缺陷种类繁多问题。数据筛 华为 巡检 选效率提升 30 倍、筛选质量提升 5 倍 ,模型的精度比普通模型提升 18% 。 1 个模型覆盖 9 种物流场景,监测收货、入库、在库和出库全流程。关键能力:大模型具 CV 大模型 备强泛化能力,一个模型同时做行为异常,轨迹异常检测;利用大模型的时空对齐能力, 物流 综合多摄像头数据,解决局部遮挡等问题,准确估计物体轨迹异常样本种类多、数量少的 场景可利用小样本数据取得高精准度结果。 资料来源:网上公开信息整理,招银国际环球市场 敬请参阅尾页之免责声明 21
22 .2023 年 2 月 10 日 潜在受益标的 敬请参阅尾页之免责声明 22
23 .2023 年 2 月 10 日 微软(MSFT US):深度融合 OpenAI 工具,技术和应用并行 投资 OpenAI, 全线接入 OpenAI 应用。作为 OpenAI 股东(持股 49%),微软将全线接入 OpenAI 应用,包括将 ChatGPT、DALL-E 等整合进搜索、浏览器、Office、云服务、 Teams 聊天程序等。2 月 8 日,微软推出集成 ChatGPT 的全新 Bing 搜索服务,以及集成 AI 辅助的 Edge 浏览器。新版 Bing 搜索引擎新增一个扩展聊天框,在回答问题的同时帮助 即时生成个性化分析和建议(如做方案、写故事、写代码、做菜单等)。Edge 浏览器则是新 增聊天和内容创作两项功能,可帮助读报告(AI 助手整合摘要和关键点、做对比分析)、写 邮件、发帖等。 图 33:新版 Bing 搜索引擎 (集成 ChatGPT) 图 34:Edge 浏览器帮助进行 Linkedin 发帖 资料来源:Bing,招银国际环球市场 资料来源:Edge, 招银国际环球市场 大模型+云计算基础设施领先,AIGC 布局广泛。微软和英伟达合作的 Megatron Turing NLG 超大语言模型具备高参数优势(5300 亿),叠加 Azure 云平台接入,为微软 AIGC 布局 及 OpenAI 训练开发提供强大支持。微软在 AIGC 应用层面布局广泛,涵盖 AI 编程 (Copilot)、AI 生成图像(小冰框架)、AI 视频(GODIVA)、数字人(小冰)等。 敬请参阅尾页之免责声明 23
24 .2023 年 2 月 10 日 谷 歌 ( GOOG US ) : 发 布 “Bard AI” 及 开 放 生 成 语 言 API, LaMDA 大模型积淀深厚 谷歌推出类 ChatGPT 产品:基于 LaMDA 大模型的 Bard 聊天机器人。与 ChatGPT 相比, Bard 能够融合互联网最新事件信息,而 ChatGPT 则是基于 2021 年之前语料库。虽然 2 月 8 日谷歌 Bard AI 在演示中给出了错误回答(市场反馈负面),但我们认为训练模型局限下类 似产品都存在回答并非准确的缺陷,后续效果仍待观察。谷歌 LaMDA 大模型参数量(1370 亿)略低于 OpenAI, 其特色为开放域互动对话能力。此外,谷歌计划 3 月将向企业、开发者 和创造者开放生成语言 API,鼓励开发者通过 API 打造自身产品。谷歌 AIGC 产品包括 AI 生成音频(Magenta),AI 生成图像(Imagen, Parti, NeRF, NeRV)和 AI 生成视频(Imagen Video,Phenaki)。 图 35:谷歌 Bard 聊天机器人 图 36:LaMDA 大模型训练方式 资料来源:谷歌,招银国际环球市场 资料来源:谷歌研究院, 招银国际环球市场 敬请参阅尾页之免责声明 24
25 .2023 年 2 月 10 日 百度(9888 HK):全栈式 AI 技术先锋,文心一言+数字人+AI 创作平台矩阵丰富 百度作为国内首个“All in AI”头部平台,以“文心大模型+深度学习”为技术底座,在 ChatGPT 及 AIGC 领域拥有天然技术储备和全栈式布局优势。相较于行业小模型路线,大模型泛化 能力强、智能程度领先、研发更标准(高参数量数据训练+“填喂”优化),极高的前期开发成 本构筑壁垒,且多模态多任务优势凸显、长尾投入低。相较于当前部分头部平台“卷参数”、 “比落地”的大模型,百度文心大模型更加侧重产业化 (to B)、产品化(“文心百中”,“文心一格” 等)及知识增强。目前文心拥有 36 个大模型(业界规模最大),涵盖能源、金融、航天、制造、 传媒、城市、社科、影视等领域,且参数量达 2600 亿(高于 OpenAI ChatGPT 1750 亿)。 期待文心大模型应用到搜索引擎、智能云的业务协同,同时对外将加速产业渗透及多下游 应用。 图 37:百度文心大模型全景图 资料来源: 百度 憧憬“文心一言”内测推出,赋能搜索引擎提效。百度宣布“文心一言” (ERNIE Bot)计划于 今年 3 月完成内测并开放,以对标海外“ChatGPT”。预计产品落地将融入百度搜索,提供 多答案回复、智能生成等功能。在文心大模型加持下,我们期待“文心一言”上线后用户迅速 起量(中国有海量用户基数),功能赋能搜索引擎后有望提高搜索转化率,短期财务影响有限, 但未来商业化空间可期 (当前 ChatGPT 推出付费订阅模式: US$20/每月)。当前市场存在对 文心一言“中文文本质量”、“监管内容审查”部分担忧,但我们认为高参数量加持下部分中文 质量影响有限,且模型自我审查能力加强下降低敏感内容回答风险。 数字人:打造数字人家族,多平台合作推动 AIGC 加速渗透。百度智能数字人平台依托百 度智能云及 AI 能力,提供 2D/3D 的服务型及演艺型数字人形象生产和创作 (输入文本后可 直接生成数字人口型匹配的视频,数字人口型合成准确率达 98.5%,基于百亿参数对话大 模型 PLATO),服务金融、运营商、互娱/品牌商、媒体/广电、MCN 等行业。例如,百度 数字人 “度晓晓”自 2020 年上线后,多次主持百度世界大会、创作歌曲、画作、直播等,能 够以 40 秒完成 40 篇高考作文。未来随着 AI 算法突破,我们看好数字人制作周期缩短、成 本下降下产业的加速渗透。 敬请参阅尾页之免责声明 25
26 .2023 年 2 月 10 日 图 38:百度数字人产品架构 百度数字人产品架构 百度数字人家族入驻快手 资料来源:百度,招银国际环球市场 智能创作平台:视频创作+智能写作赋能内容生产。百度智能创作平台提供一站式 AI 创作 服务和工具(于 2022 年 4 月正式商用),涵盖视频创作、图片创作和智能写作,赋能媒体、 金融、政企等多行业,自动创作文章/短视频 200 万+/15 万+,并和超 20 家媒体落地合 作。其中,视频 AI 创作主要基于多模态创作技术,创作者可高效、低成本、低门槛的实现 “图文转视频”、“数据转视频”、“智能配音”、虚拟主播等功能(13 种工具)。智能写作则是集 合庞大语料库和资讯素材,提供自动写作的同时具备纠错、润色、标题推荐等服务。 图 39:百度 AI 智能写作 图 40:百度 AI 视频创作 资料来源:百度,招银国际环球市场 资料来源:百度, 招银国际环球市场 敬请参阅尾页之免责声明 26
27 .2023 年 2 月 10 日 腾讯 (700 HK):混元 AI 大模型赋能多业务场景落地、实现技术 提效 基于海量社交数据、机器学习、NLP 等技术积累,腾讯于 2022 年 12 月推出了万亿中文 NLP 预训练模型 HunYuan-NLP-1T (混元 AI 大模型),是目前国内首个低成本、可落地的 NLP 万亿大模型,且登顶自然语言理解任务榜单 CLUE。在模型架构层面,和其他大模型 相比,混元首创“层级化”表征,对输入文字/视频做分层后再进行关联性检索,大幅提升检 索准确度。 图 41:腾讯混元 AI 大模型 应用层 广告 搜索 推荐 游戏 翻译 对话 模型层 行业/领域/任务模型 NLP大模型 CV大模型 多模态大模型 文生图大模型 数据层 多源训练数据脱敏/清洗/平台化 评测数据和标准共建 太极机器学习平台 模型训练AngelPTM(GPU训练加 模型推理及压缩HCF Toolkit(轻量化/蒸 产品套件(研发管线/数据&模型管 速/4D并行) 馏/推理服务) 理) 算力平台 高性能网络平台 计算集群(CPU/GPU) 网络通信(RDMA) 资料来源:腾讯,招银国际环球市场 图 42:腾讯混元大模型在五大跨模态视频检索数据集榜单排名首位 DRL MDMMT-2 腾讯 PCG CAMoE CLIP3Clip Method Hunyuan_tvr (阿里) (华为) (CLIP2video) (快手) (微软) MSR-VTT 55.0% 53.3% 48.8% 52.9% 48.8% 44.5% MSVD 58.2% 50.0% 56.8% 47.0% 49.8% 46.2% LSMDC 29.7% 26.5% 26.9% - 25.9% 22.6% DiDeMo 52.1% 49.0% - - - 41.4% ActivityNet 57.3% 46.2% - - - 41.4% 资料来源: 腾讯 注释: MSR-VTT、MSVD、 LSMDC、DiDeMo、ActivityNet 是行业内最具权威性的五大跨模态视频检索数据集榜 单,主办单位包括微软、加州大学伯克利、阿卜杜拉国王科技大学等 大模型多产品协同,广告降本提效显著。混元涵盖 NLP、CV、多模态、文生图等大模型, 对内已和腾讯广告、微信、QQ、游戏等产品实现协同,并通过腾讯云对外商业化。有别于 百度文心与搜索的融合,腾讯大模型在广告提效层面更为显著:依托于太极机器学习平台, 腾讯广告通过两大模型训练(混元 AI 大模型与广告大模型)强化内容理解、精准匹配、文案 创意生成等能力,有效提升投放 ROI。同时,在大模型广告智能创作下,文案转视频功能 亦大幅降低视频广告制作成本。 敬请参阅尾页之免责声明 27
28 .2023 年 2 月 10 日 图 43:混云模型架构示意图 图 44:腾讯广告系统搭载“一大平台两大模型” 资料来源:腾讯,招银国际环球市场 资料来源:腾讯, 招银国际环球市场 实验室矩阵支撑 AIGC 能力建设,围绕“内容+社交+游戏”多元布局。腾讯依托 AI Lab、优 图实验室、微信 AI 等多个 AI 实验室,积极布局 AIGC 产品,包括 AI 生成文字(梦幻写手 Dreamwriter)、AI 生成游戏(绝悟 AI)、AI 绘画 (腾讯 QQ 小世界 AI 画匠)、数字人(AI Lab 数 字人 PaaS 方案,创建的数字人“艾灵”) 等。例如,腾讯 2022 年 12 月由 AI Lab 研发的智能 创作助手文涌(Effidit)更新至 2.0 版本,新增风格化智能续写功能。 图 45:腾讯 AI Lab 数字人全栈技术管线和场景解决方案 资料来源:腾讯,招银国际环球市场 敬请参阅尾页之免责声明 28
29 .2023 年 2 月 10 日 阿里巴巴 (BABA US):通义大模型凸显开源,构建 AI 统一底座 通义大模型构建 AI 统一底座,类 ChatGPT 产品研发内测中。阿里达摩院于 2021 年发布使 用 512 卡 V100 GPU 实现全球最大规模 10 万亿参数多模态大模型 M6,并于 2022 年发布 最新「通义」大模型系列。通义大模型注重开源开放,首次通过“统一范式”实现多模态、多 任务、多结构的运行,并通过模块化设计实现高效率高性能。其中,通义 – AliceMind(深 度语言模型体系)在中文语言理解测评基础 CLUE 上三个维度排名首位。基于大模型技术 储备、强大的算力及云服务支持,阿里目前在积极研发类 ChatGPT 产品 (处于内测阶段), 或通过 AI 大模型与钉钉合作。 图 46:阿里通义大模型架构 资料来源:阿里巴巴,招银国际环球市场 图 47:阿里 AliceMind 模型结果在中文语言理解测评基础 CLUE 上获得了三榜第一 排行 模型 研究机构 测评时间 Socore 1.1 认证 AFQMC TNEWS 1.1 IFLYTEK OCNLI_50K WSC 1.1 CSL CMRC 2018 CHID 1.1 C3 1.1 1 HUMAN CLUE 19-12-01 86.678 已认证 81.0 71.0 80.3 90.3 98.0 84.0 92.4 87.1 86.0 2 通义-AliceMind 达摩院NLP 22-08-31 85.738 待认证 83.4 71.6 65.7 83.3 94.1 94.9 86.8 99.2 92.7 3 Wenjin Meituan NLP 22-06-24 84.900 待认证 83.5 69.6 64.4 85.6 92.3 93.2 86.3 98.9 90.4 4 HunYuan_ntp 腾讯 TEG 22-05-11 84.730 待认证 83.4 64.0 66.6 85.2 92.3 93.9 87.9 98.5 90.8 5 ShenNonQ 云小微AI 21-12-01 84.351 待认证 82.6 65.6 64.4 86.0 94.2 91.2 86.5 97.9 90.8 6 Shenzhou QQ浏览器实验室 21-09-19 83.873 待认证 80.6 65.4 67.7 86.4 89.1 91.0 87.9 97.9 89.1 7 OBERT OPPO-小布助手 22-06-01 81.383 待认证 77.9 65.8 63.9 83.4 91.0 87.3 84.1 94.7 84.4 8 CL-BERT CL-BERT 22-04-06 81.288 待认证 82.4 64.0 64.8 82.8 88.6 91.5 82.0 98.5 77.0 9 Mengzi 澜舟科技-创新工场 21-09-14 81.092 待认证 81.8 65.2 65.1 82.6 86.5 89.9 84.0 95.1 79.8 10 PAI-EasyNLP BERT wjn1996 22-07-12 80.570 待认证 77.1 61.2 61.2 82.8 87.1 94.2 77.3 97.7 86.6 资料来源: 阿里巴巴 图 48:通义大模型文生图效果展示:文艺复兴时期皇家花栗鼠肖像画 资料来源:阿里巴巴,招银国际环球市场 AIGC 智能客服先行,视觉生成、在线设计、在线试穿等多点开花。相较于 AIGC 在百度搜 索、腾讯广告中的应用侧重,我们认为阿里 AIGC 落地场景更多为智能客服(未来 ChatGPT 融入后对话将更为类人及智能)及广告,助于提升电商消费体验并降低运营成本。当前阿里 云智能客服已全面应用通义大模型,在表格问答层面交付准确率达到 90%+,对外服务近 20 个行业。此外,阿里在 AI 生成文学(阿里 DT 稿王)、AI 视觉(阿里鹿班)、AI 设计 敬请参阅尾页之免责声明 29