美团 阴永俊《美团配送系统架构演进实践》

展开查看详情

1.美团配送系统架构演进实践 阴永俊

2.阴永俊 美团点评资深技术专家、美团配送业务系统团队负责人 2010年大连理工大学毕业,曾先后任职于Hikvision、人人网,从事过视频 监控、广告、IM、DevOps、中间件、数据仓库等技术方向 2015年加入美团・大众点评,负责配送业务系统建设,重点负责系统质量 保证、运营体系建设、核心系统架构升级等方向,支持美团配送业务发展

3.Agenda 01 美团配送业务介绍 02 MVP阶段 03 规模化阶段 04 精细化阶段

4.海内外掀起一波创业浪潮 同城即时配送快送发展 Uber Eats Doordash Instacart Swiggy go-jek 美团外卖 饿了么 点我达 闪送 UU跑腿

5.基础设施不断升级 与 用户消费升级 促使即时配送全面信息化 美团配送系统:机器与海量骑手协作,服务于全国商家与用户 1.基础设施不断完善 配送业务全面信息化是必然趋势 人工智能 • 预测供需结构,智能派单调度 履约能力 大数据 • 评估难度、ETA、骑手能力等数据 实现平台对运单调度的实时把控,对运单与运力的供需匹配 GPS+GIS • 定位越来越精准,地图与导航逐渐成熟 履约流程:下单 -> 派单 -> 接单 -> 取货 -> 送达… 移动互联网 • 实时移动的信息传递通路 运营效率 智能手机/APP • 线下配送的全过程纳入信息环境 加强对配送骑手的管控能力 提升配送全业务的运营效率,降低成本 2.用户消费升级 业务团队:招聘、采购、物料、培训、薪酬、保险.... 运营团队:运力结构、经营分析、绩效考核.... 客服团队:问题跟进、定责… 数据来源:智研咨询

6.履约SLA要求高,重线下业务运营 美团配送系统的技术挑战 快速 放心 用户 销量 省钱 • 用户:花了钱却饿着肚子 SLA更高 • 商家:出了餐却无人配送 • 骑手:投入的时间、劳动却少赚了钱 品牌 商家 信赖 • 多业务线的共性与差异:专送、代理、众包… 收入 业务复杂性高 • 运营复杂度高:定义科学的订单供给与运力结构,并精准调控 • 安全管理:用户安全、商家安全、骑手安全 骑手 稳定 安全

7.从支撑业务到驱动业务 配送系统的技术定位与思路 初期造工具,解决能不能 长期造壁垒,实现降维打击能力

8.Agenda 01 美团配送业务介绍 02 MVP阶段 03 规模化阶段 04 精细化阶段

9.从零到一 MVP阶段 业务从零到一 快速迭代、业务试错 管理端 骑手APP 外卖系统 人员 资金 运单 核心链路MVP、主流程跑通 • 按照粗领域拆分系统边界 DB • 按照三大信息流(人、财、物)划分系统 外卖 配送 • 如何支撑快速试错: • 项目制; PM、RD = QA; 区分履约服务与运营服务

10.Agenda 01 美团配送业务介绍 02 MVP阶段 03 规模化阶段 04 精细化阶段

11.快速起量,系统质量、研发效率问题凸显 规模化阶段 • 整体需要思考的关键问题 • 整体系统架构应该如何演化 快速起量 • 履约系统与运营系统的边界在哪里 系统质量、研发效率问题凸显 • 履约系统面临的问题 • 如何保证可用性 • 如何保证系统容量 化繁为简、分而治之、逐步演进 • 如何提升计算能力 • 运营系统面临的问题 • 提升运营系统迭代效率

12.快速起量,系统质量、研发效率问题凸显 规模化阶段:核心领域细分 管理工作台 接单网关 骑手网关 HRM 招募 物料 培训 标准API 容灾 标准API 多链路 移动办公 IM 薪资 成长 容灾 API管理 APP运维 安全框架 经营规划 业务管理 骑手运营 结算平台 订单中心 运单中心 调度中心 策略平台 (目标) (过程) (人) (钱) (送什么) (配送任务) (工程框架) (算法策略) 盈亏 运营工具 任务 清算 品类 运单归属 需求池 算法框架 绩效 任务系统 活动 结算 重量 配送状态 运力池 分析平台 奖惩 合同 等级 对账 支付状态 计算平台 主数据平台 (核心模型) 账号权限 组织架构 核心数据模型 配送服务 配送运力

13.快速起量,系统质量、研发效率问题凸显 规模化阶段:核心领域细分 管理工作台 接单网关 骑手网关 履约系统 HRM 招募 物料 培训 标准API 容灾 标准API 多链路 • 如何解耦用户侧与骑手侧 移动办公 IM 薪资 成长 容灾 API管理 APP运维 安全框架 • 调度系统如何设计 经营规划 业务管理 骑手运营 结算平台 订单中心 运单中心 调度中心 策略平台 • 如何实现算法与工程结合 (目标) (过程) (人) (钱) (送什么) (配送任务) (工程框架) (算法策略) 盈亏 运营工具 任务 清算 品类 运单归属 需求池 算法框架 绩效 任务系统 活动 结算 重量 配送状态 运力池 分析平台 奖惩 合同 等级 对账 支付状态 并行计算 主数据平台 (核心模型) 账号权限 组织架构 核心数据模型 配送服务 配送运力

14.快速起量,系统质量、研发效率问题凸显 规模化阶段:核心领域细分 管理工作台 运营系统 接单网关 骑手网关 HRM 招募 物料 培训 需求长期多而杂,运营系统到底应该管什么 • 标准API 监控 标准API 多链路 移动办公 IM 薪资 成长 补发 补发 APP运维 安全框架 • 科学设定目标并达成的能力 经营规划 业务管理 骑手运营 结算平台 • 各类管理动作的效率提升与结果保证 订单中心 运单中心 调度中心 策略平台 (目标) (过程) (人) (钱) (送什么) (配送任务) (工程框架) (算法策略) 盈亏 运营工具 任务 清算 • 品类 定义科学的运力结构 运单归属 需求池 算法框架 绩效 任务系统 活动 结算 • 重量 提升物质激励效果 配送状态 运力池 分析平台 奖惩 合同 等级 对账 支付状态 计算平台 主数据平台 (核心模型) 账号权限 组织架构 核心数据模型 配送服务 配送运力

15.快速起量,系统质量、研发效率问题凸显 规模化阶段:核心领域细分 管理工作台 接单网关 骑手网关 主数据平台 HRM 招募 物料 培训 标准API 容灾 标准API 多链路 • 什么是主数据 移动办公 IM 薪资 成长 容灾 API管理 APP运维 安全框架 • 为什么要管 经营规划 业务管理 骑手运营 结算平台 订单中心 运单中心 调度中心 策略平台 • O2O类系统架构设计上非常关键的问题 (目标) (过程) (人) (钱) (送什么) (配送任务) (工程框架) (算法策略) • 如何管 盈亏 运营工具 任务 清算 品类 运单归属 需求池 算法框架 绩效 任务系统 活动 结算 重量 配送状态 运力池 分析平台 奖惩 合同 等级 对账 支付状态 计算平台 主数据平台 (核心模型) 账号权限 组织架构 核心数据模型 配送服务 配送运力

16.快速起量,系统质量、研发效率问题凸显 规模化阶段:解耦履约系统与运营系统 • 开放式 v1.0 • 多服务共享DB • 服务化 v2.0 • 原语层+应用层 • 借鉴CQRS + MDM思想 v3.0 • 生产与应用独立建模 美团配送主数据平台架构图

17.快速起量,系统质量、研发效率问题凸显 规模化阶段:解耦履约系统与运营系统 数据生产 • 骑手入职、转岗、组织拆分各类流程设计 • 开放式 v1.0 • 多服务共享DB • 服务化 v2.0 • 原语层+应用层 • 借鉴CQRS + MDM思想 v3.0 • 生产与应用独立建模

18.快速起量,系统质量、研发效率问题凸显 规模化阶段:解耦履约系统与运营系统 核心数据模型 • 无论入职流程、调度流程多复杂,原语接口不变 • 开放式 v1.0 • 多服务共享DB • 服务化 v2.0 • 原语层+应用层 • 借鉴CQRS + MDM思想 v3.0 • 生产与应用独立建模

19.快速起量,系统质量、研发效率问题凸显 规模化阶段:解耦履约系统与运营系统 履约侧应用 • 屏蔽人员、组织属性细节,高可用性保证 • 开放式 v1.0 • 多服务共享DB • 服务化 v2.0 • 原语层+应用层 • 借鉴CQRS + MDM思想 v3.0 • 生产与应用独立建模

20.快速起量,系统质量、研发效率问题凸显 规模化阶段:解耦履约系统与运营系统 运营侧应用 • 提供搜索、权限、审批解决方案,保证扩展性 • 开放式 v1.0 • 多服务共享DB • 服务化 v2.0 • 原语层+应用层 • 借鉴CQRS + MDM思想 v3.0 • 生产与应用独立建模

21.快速起量,系统质量、研发效率问题凸显 规模化阶段:可用性建设 流程建设 系统建设 上线规范、扩容流程、重构流程、CR流程 压测平台、自动巡检 预防能力 周巡检/日巡检制度 系统容量规划、系统吞吐量提升 四层监控体系、业务大盘、APP大盘 诊断能力 线上故障处理SOP Cat监控平台、MTrace、端到端日志分析 解决能力 故障演练 应急管理平台 规避能力 研发高压线、月度Case复盘、CaseStudy 故障管理平台 初期偏重流程建设(保证结果) 后期偏重系统建设(提升人效)

22.快速起量,系统质量、研发效率问题凸显 规模化阶段:容灾能力 v1.0 基于open-falcon的基础监控 核心依赖 端到端 服务SLA分级 与 场景化 • 单接口、核心依赖降级 • 业务大盘、Trace • 容灾预案集成到系统 核心依赖 ->  端到端 ->  场景化 的监控与容灾预案

23.快速起量,系统质量、研发效率问题凸显 规模化阶段:系统容量 静态评估 冗余备份 工具辅助评估 垂直拆分 场景压测 水平拆分 全链路压测 自动归档 容量评估由人到系统 容量提升分阶段实施

24.快速起量,系统质量、研发效率问题凸显 规模化阶段:并行计算能力 • 外卖场景下的配送计算能力要求 计算能力是智能调度的关键!

25.快速起量,系统质量、研发效率问题凸显 规模化阶段:提升各类运营系统迭代效率 K Eb_ Kd / • 打造运营系统集成统一解决方案 g luveHU A M lu K / Lmjh • 例:流程平台 + 动态表单 g K jh 流程大盘提升业务流程效率与结果 i b_S K // K 元数据 表单 样式 规则 管理动态表单 ( 管理 管理 引擎 s M tab_S n D r ( QoS V jh P S y K Kjh l ( 流程平台 Sjh n jh T . ) K s c

26.Agenda 01 美团配送业务介绍 02 MVP阶段 03 规模化阶段 04 精细化阶段

27.产品技术创新驱动业务发展 精细化阶段 行业方案 同城建设方案 配送履约方案 骑手运营方案 具体技术 时间 单量 POI 骑行 供需 弹性 配送 站点 订单 路径 语音 配送 预估 预估 定位 导航 平衡 研究 范围 规划 指派 规划 助手 硬件 美团配送 AI整体布局 技术方向 预测预估 轨迹挖掘 定价机制 智能规划 智能调度 智能硬件 学科方向 Spatial-Temporal Data Mining 、Operations Research 、Machine Learning 如何更好地发挥大数据与AI的价值 效果验证 算法特征 导航 降低试错成本 提升算法特征迭代效率 提升导航数据质量 仿真平台 特征平台 LBS平台 最大化降低算法的线上试错成本 统一算法策略迭代框架,数据生产框架 提供 坐标流、导航路径、空间索引 能力 打造算法沙箱环境 提升特征数据质量 打磨各类位置与导航策略场景

28.产品技术创新驱动业务发展 精细化阶段:仿真平台 目标:构建线下模拟沙盘 思路:基于线上真实数据对配送全流程构建模拟场景,并对事件、数据模拟 仿真报告可视化

29.产品技术创新驱动业务发展 精细化阶段:特征平台 版本管理:缩短实验周期,灵活配置实验规则 实时特征:特征准实时加工、离线特征实时转化 离线特征:特征快速开发、验证、上线能力