邓亚锋-如何打造大规模视觉计算系统

下载 5

海牛不是牛

发布于

4741

人观看

#信息技术

邓亚锋-如何打造大规模视觉计算系统

展开查看详情

1 .如何打造大规模视觉计算系统邓亚峰格灵深瞳 1

2 .

3 .

4 .计算机视觉是人工智能领域最重要的方向之一人工智能应用领域各感觉器官接受信息比例自动驾驶人工智能技术领域视觉智慧城市计算机听觉视觉智慧医疗嗅觉机器人语音识别核心算法：机器学习触觉自然语言深度学习味觉增强现实理解计算机视觉是当前中国最活跃、与国际水平最相近的AI方向之一 2

5 .计算机视觉是智慧物联网时代最大的数据入口，拥有广阔的应用场景感知分析大数据应用计算机视觉技术安防交通零售数据采集计算机视觉推动视频大移动互数据广泛应联网金融互联网以深度学用物理世界习为核心机器人自动驾驶医疗中国计算机视觉市场规模中国大数据应用市场规模 800 视频大数据 600 725 8229 10000 6090 行业前景广 400 4163 5000 阔 200 319 767 1106 1776 2665 11 40 120 0 0 2016e 2017e 2018e 2019e 2020e 2014 2015 2016 2017 2018 2019 2020 市场规模（亿元）市场规模（亿元） 3

6 .计算机视觉技术愿景目标类别人脸人体车辆商品更全功能更加位置检属性识身份识行为识关系识丰富测别别别别理解粒度更细分类检测关键点检测语义分割功能更加丰富、精度更高、速度更快、成本更低、规模更大 4

7 .何为大规模视觉计算系统视觉计算系统：云+边+端软硬结合大规模：显性因素：接入路数多、数据量大、功能丰富；挑战隐性因素：单路成本低、处理效率高、准确率高、训练数据量大、模型多； 5

8 .构建大规模视觉计算系统的关键因素核心算法大规模自动化训练框架智能数据挖掘和标注系统基于硬件平台的计算优化 6

9 .算法需要极致打磨系统流程系统参 Loss函数&训练数参数模型结模型蒸构馏数据&数据处理方式对于每一个算法，都需要尝试多种改进方向 7

10 .人脸识别基本流程检测人脸检测人脸特征点定位关键点定位人脸几何矫正几何矫正人脸特征提取特征表示 8

11 .人脸特征提取&检索流程在线检索离线建库特特深度神经征相似度征深度神经网络表得分表网络示示特相似度征深度神经得分表网络示核心技术点：简短、精准的表示模型快速的检索算法特相似度征深度神经得分表网络示 9

12 . 人脸识别算法Loss函数演进（举例） Image1-> CNN->特征1 是否是一个人 Image2-> CNN->特征2 Pair-wise Loss(Siamese network) Triplet Loss Softmax Center Loss 限制条件||f||=const、||W||=const和b=0 NormFace/CocoLoss InsightFace/ArcFace 10

13 .人脸识别系统影响因素 • 训练数据：数据量、纯度、数据分布 • 数据增强：克服分辨率、光照、模糊等因素 • 检测/Alignment精度提升 • 人脸识别Loss函数设计 • 超大规模模型训练框架 • 模型加速(Model Distilling、量化等) • 部件模型融合 • 视频人脸跟踪 • 人脸质量评估 • 视频人脸多帧融合 • 利用数据Fine-Tune来充分利用数据提升场景适应性 • …… 11

14 .图像检测方法基于滑动窗口的方法（统治近20年） RCNN（2014） Fast-RCNN（2015） Faster-RCNN（2016） 12 R-FCN（2016）

15 .SSD检测框架（2016年） SSD主要包含以下几个部分： • 基础网络（e.g. VGG-16） • 添加多个卷积层，用于实现跨尺度目标检测 • 在每一个添加的卷积层上用一组不同aspect ratio的sliding window提取候选区域 • 分类+回归损失函数 13

16 .影响检测效果的重要因素网络结构 Negative Loss Hard Function Sample Mining Anchor参 NMS 数 Learning Rate 14

17 .挑战如何在算法人员有限、数据资源有限的情况下，打造一流的核心算法？ 15

18 .传统算法开发模式传统算法工程师工作时间分配：算法模型 60%在处理数据 20%在调参 15%在实现算法手工训练 5%在思考算法缺点：标注数据数据标注成本高数据依赖于算法工程师，无法持续 GPU利用率低算法工程数据标注师员 16

19 .改进算法开发模式算法模型新型算法工程师工作时间分配： 20%在沟通确定数据处理流程 10%在调参训练平台 50%在实现算法 20%在思考算法算法工程标注数据师优点： GPU利用率提升数据收集、处理数据标注数据费用下降和标注平台员数据量持续增加数据平台开发 17

20 .打造高效的自动化训练管理平台目标：提升算法人员产出效率，节省人力提高训练资源的利用率训练任务管理：训练集管理代码/参数管理环境管理计算资源管理模型评测和选择训练方式：自动化模式虚拟机模式云主机模式 18

21 .拥有大规模集群训练能力已有开源框架：Caffe、MxNet、TensorFlow、PyTorch、PaddlePaddle等 • 完全重复造轮子并不必要的：开源框架有行业里面最好的工程师的贡献；对员工而言，技能更加熟练，容易上手和适应；可以利用更多的开源社区的开源算法，更容易和业界交流； • 但要有基于开源框架构建大规模训练框架的能力：现有框架并行度做得不好超大规模问题需要自己解决 19

22 .打造大规模训练集群问题：如何解决数亿类别的分类任务？网络结构 Loss函数：当类别数是1亿时，特征长度是128维时，参数矩阵参数数据量约为51G 20

23 .打造大规模训练集群 – 数据并行+模型并行 N计算节点每节点M卡 Batch数据并行数据并行特征计算 GPU_1 batch_1_1 X_1_1=CNN(batch_1_1) GPU_2 batch_1_2 X_1_2=CNN(batch_1_2) Machine_1 … … GPU_M batch_1_M X_1_M=CNN(batch_1_M) 步骤一 GPU_1 batch_2_1 X_2_1=CNN(batch_2_1) GPU_2 batch_2_2 X_2_2=CNN(batch_2_2) Machine_2 … … GPU_M batch_2_M X_2_M=CNN(batch_2_M) … … … N计算节特征汇模型并模型并行FC计算通信优化(FW+BP) 梯度汇聚点聚行 W_1_1 X*W_1_1 grad_X_1_1, grad_W_1_1 W_1_2 X*W_1_2 grad_X_1_2, grad_W_1_2 Machine_1 … … … 步骤二 W_1_M X*W_1_M grad_X_1_M, grad_W_1_M X W_2_1 X*W_2_1 grad_X_2_1, grad_W_2_1 grad_X W_2_2 X*W_2_2 grad_X_2_2, grad_W_2_2 Machine_2 … … … W_2_M X*W_2_M grad_X_2_M, grad_W_2_M … … … … 21

24 .通过数据平台持续高效获取海量训练数据 • 如何便捷、低成本的获取数据 • 数据源 • 选择标注工作量小的有先验约束的数据源 • 例如： • 相册数据 • 人脸1：1人证数据 • 处理流程 • 全部人工标注吗？ • 隐私问题 • 成本问题 • 人工标注的准确性相册数据源 22

25 . 人脸自动数据标注流程使用更优质人脸模型提取特征 02 04 06 检测、定位、获取、归一在子集中聚类，同时去化人脸区域，计算质量、除非常相似人脸，降低属性，使用人脸模型提取裁剪后人脸模型训练处理数据量簇内聚类后人脸人脸模型特征质量阈值过滤误检、模分析类间相似度，去除糊及大角度人脸，减小类间噪声，生成训练集处理过程出错几率原始采集图片质量清洗后人脸 01 03 人脸训练集 05 23

26 .数据团队的工作模式算法提出困难数据数据处理算法同学需求挖掘和标注训练提升传统工作模式利用训练困难数据数据处理已有任务框架自动挖掘和标注训练数据驱动工作模式 24

27 .数据驱动模型效果提升驾驶员面部遮挡副驾人员面部遮挡 25

28 .视觉计算系统预测架构 APP 分布式多机架构 Processing pipeline Module SDK Inference 算法模型 Framework 算法数据训练平台芯片 26

29 . 预测框架 Caffe Keras MXNet PyTorch Caffe2 CNTK Tensor 预测框架 Flow 神经网络& OpenBLAS cuDNN/ CoreML NNVM/ ONNX TensorRT Atlas cuBLAS TVM 矩阵运算 X86 ARM CUDA OpenCL Metal 系统指令集层 27

6点赞

5收藏

5下载