数据驱动员工成长,AI辅助研发评优

活动介绍

由示说网与方云数据携手举办的研发数字化管理公开课,将于9月3日20:00线上开启,我们将携手方云研发绩效CEO、前随行付CTO于人带来进行主题分享,届时将着力于如何用“数据驱动员工成长,AI 辅助研发评优”的话题展开探讨。

物联网、云计算、大数据、移动化、智能化技术日趋成熟,疫情造成持续影响,倒逼全链业务上云;数字化转型,已经从可选项转变为必选项。

与之对应,企业管理者对研发团队数字化要求越来越高

  • 研发团队争取战略地位,需要用数据自证贡献价值;
  • 研发团队推动业务端优化流程,需用数据展示收益;
  • 研发团队内部绩效评价,要基于客观数据评测,以体现公平公正。

本次分享实战体系源自20+数字化管理实施案例,规避数字化转型常见雷区,帮助研发团队落地开箱即用的数字化管理体系。

您将收获

  • 重新理解数字化时间管理
  • 数字化时间管理如何实现增产提效
  • 基于考勤/工时/任务管理,打造高自尊团队
  • 增产提效要满足的三大必要条件
  • 数据画像在研发管理体系中的核心应用场景
展开查看详情

1. 训练 营 发 管 理 数据驱动员工成长,AI辅助研发评优 字 化 研 方 云 数 于人 2020.9 1

2.自我介绍 于人 训练 营 方云数据CEO、前随行付CTO 发 管 理 字 化 研 15年开发经验、12年技术管理经验 方 云 数 社科院 管理哲学 博士 中国人民大学 EMBA 2

3. 训练 营 发 管 理 字 化 研 方 云 数 3

4. 训练 营 发 管 理 字 化 研 方 云 数 老外屌丝中文哥超强12人模仿(2012年) https://www.bilibili.com/video/av255501?from=search&seid=1858820810630355762

5. 训练 营 发 管 理 字 化 研 方 云 数 男人不懂的东西 5 女人不懂的东西

6.主观偏差无处不在,管理评价要有客观纠错机制 刻板印象 首因效应 训练 营 近因效应 发 管 理 晕轮效应 字 化 研 感情效应 方 云 数 暗示效应 偏见误差 …… 6

7.智能算法:监督学习、决策树等算法全面赋能上级评价 上级的主观评价 理性决策 潜意识 训 练 营 认知盲区 发 管 理 字 化 研 方 云 数 规则引擎 监督学习 聚类算法 ⽅云 AI 算法,客观量化为评价赋能 7

8.方云数据专家团,创新理论、前沿科技与实战经验结合 刘军 陈运涛 胡豫陇 教授 博导 教授 博士后 中国人民大学 北京交通大学 训练 营 清华大学 组织行为学 质量管理 发 管 理 算法建模 字 化 研 方 云 数于人 方云 创始人 谭健 方云 合伙人 12年研发管理经验 10年研发管理经验 社科院 管理哲学 博士 英国 Essex 硕士 中国人民大学 EMBA 8

9. 训 练 营 1 发 管 理 PART 01 字 化 研 方云 数 聚类算法辅助研发评优 9

10. 聚类算法:识别特征、针对培养 聚类算法:识别特征、针对培养 老黄牛 训练 营 优秀员工 发 管 理 字 化 研 方 云 数 南郭先生 普通员工 10

11.第一步:围绕聚类目的,构建数据池 训练 营 数据来源 数据组成 发 管 理 分析目标 字 化 研 方 云 数 某企业员工, 成果产出、工作时间、 研发行为画像 4周内的工作 缺陷问题、组织成本 记录数据。 11

12.通过相关性筛选指标 训练 营 发 管 理 字 化 研 方 云 数 12

13. 聚类变量:RFM特征+截⾯⾏为特征 实际 缺陷 F M R 任务数 缺陷数量 组织成本 工作总时长 处理总时长 3 3 4.500 6.000 4 4 171.91 182.24 9 12 5 3 训练 13.68 7.54 营 99.7078 105.6992 理 1 1.000 4 154.03 4 5 10.02 138.2419 管 1 1.000 4 200.21 4 0 0.00 179.6885 1 1 0.333 0.167 4 1 164.07 化 研 188.41 1 1 发 3 0 4.30 0.00 114.2378 235.2770 字 2 0.667 4 205.36 2 2 8.12 142.9870 数 1 0.333 1 187.74 1 0 0.00 130.7187 云 2 0.667 4 210.29 2 4 7.18 146.4197 1 1 3 3 方 0.167 2.000 3.000 1.250 1 4 2 4 193.02 195.58 156.48 178.21 1 2 3 5 0 5 1 6 0.00 9.33 0.75 7.89 255.0277 88.0110 70.4160 146.9564 4 3.750 4 187.72 15 10 44.29 168.4787 4 1.000 4 209.80 5 6 11.97 206.1285 2 4.000 2 204.30 8 10 47.95 118.4940 13

14.第二步:选择算法 训练 营 发 管 理 字 化 研 方 云 数 14

15.两类聚类算法原理介绍 清晰聚类:Kmeans 模糊聚类:Fuzzy C-means 1. 指定聚类中心个数 1. 初始化隶属矩阵U,计算聚类中心 2. 随机选取聚类中心 营 2. 根据欧式距离范式计算样本点到中心的距离。 训练 理 3. 计算中心与样本点的欧氏距离,记录所属类别 3. 更新隶属矩阵U,直到评价函数变化小于阈值 4. 迭代求新的聚类中心 研 发 管 5. 直到聚类中心稳定 数 Tips:聚类变量间彼此独立 字 化 Tips:样本点以一定归属度(概率),属于一个类别 方 云 0. 6 0. 4 15

16. 第三步:分析聚类结果 模糊聚类: 行为边界模糊现象(图中红圈所示) SC: 0.4420 SC: 0.5638 营 S: 0.0340 S: 0.0489 练 XB: 1.3124 Kmeans-Cluster:4 XB: 0.7977 FCM-Cluster:4 管 理 训 化 研 发 云 数 字 方 16

17. - 类别1优秀员工: RFM得分高,价值点高,工作效率高; 结果分析 - 类别2普通员工: 行为趋同,各项行为数据处于中等水平。 - 类别3吃苦员工: 工作时间与普通员工一样,但任务数量、任务产出多 - 类别4落后员工: 各项行为数据偏小,工作产出很少。 实际 缺陷 已完成 营 姓名 F M R 缺陷数量 组织成本 类别 开发任务数量 练 工作总时长 处理总时长 训 小安 3 4.500 4 5 171.91 13.68 9 99.7078 1 理 小代 3 6.000 4 3 182.24 7.54 12 105.6992 1 小五 小樊 1 1 1.000 1.000 4 4 研 5 0 154.03 200.21 发 管 10.02 0.00 4 4 138.2419 179.6885 2 2 化 小郭 1 0.333 4 3 164.07 4.30 1 114.2378 2 小海 小李 2 2 云 数 0.667 0.667 字 4 4 2 4 205.36 210.29 8.12 7.18 2 2 142.9870 146.4197 2 2 方 小刘 1 2.000 4 5 195.58 9.33 2 88.0110 2 小欧 3 1.250 4 6 178.21 7.89 5 146.9564 3 小殷 4 1.000 4 6 209.80 11.97 5 206.1285 3 小田 4 3.750 4 10 187.72 44.29 15 168.4787 3 小于 2 4.000 2 10 204.30 47.95 8 118.4940 3 小韩 1 0.167 1 0 188.41 0.00 1 235.2770 4 小滨 1 0.167 1 0 193.02 0.00 1 255.0277 4 小明 1 0.333 1 0 187.74 0.00 1 130.7187 4 小孟 3 3.000 2 1 156.48 0.75 3 70.4160 4

18.聚类分析方法论总结 训练 营 数据: 分析目标: 发 管 理 分析算法: 结果检验: ·时间序列 字 化 研 ·行为轮廓 ·RFM ·管理理论实践 方 云 数 ·截面数据 ·聚类算法 ·实际行为比对 18

19.输入参数决定聚类效果:两种失败场景 Kmeans 1 营 个人产出 任务完成 严重的缺 缺陷处理 开发任务 重要的缺 练 姓名 缺陷数量 工作量 所属类别 价值 总时长 陷数量 总时长 数量 陷数量 小李 小宁 管 理 1 0.82 0.78 1 0.22 1 0.52 0.85 训 0.33 1 1 1 0.60 1 0.33 0 1 1 发 小郑 0.50 0.53 0.78 0.47 0.78 0.6 0.80 0 1 研 小周 0.31 0.83 0.11 0.02 0.22 1 0 0.33 1 小魏 0.59 0.16 0 0.02 0.11 0.6 0.15 0.33 2 化 小许 0.05 0.12 0.22 0.05 0.22 1 0.28 0 2 云 数 字 Kmeans 2 方 姓名 小李 个人产出 任务完成 严重的缺 缺陷处理 价值 1.00 总时长 陷数量 总时长 0.8 缺陷数量 0.2 开发任务 数量 工作量 0.52 0.3 1 0.59 重要的缺陷数量 所属类别 0.33 1 小宁 0.80 1.00 1 0.85 1 1 1 0 1 小魏 0.60 0.16 0 0.02 0.1 0.6 0.15 0.33 2 小许 0.04 0.12 0.2 0.05 0.2 1 0.28 0 2 小郑 0.50 0.53 0.8 0.47 0.8 0.6 0.8 0 2 小周 0.30 0.83 0.1 0.02 0.2 1 0 0.33 2 类别差异化不明显 员工向相邻类别转移,分析发现聚类原则与目标不一致 19

20. 训 练 营 好像还是离不开我,管 理 “ 云 字 化 研 发 能不能帮我自动评优? 数 ” 方 20

21. 训 练 营 2 发 管 理 PART 02 字 化 研 方云 数 监督学习辅助研发评优 21

22.监督学习:为企业量身打造评价模型 用SVM算法(监督学习)学习领导对员工的评价模式 训练 营 进而用训练好的模型直接评价员工表现。 发 管 理 其优势在于: 字 化 研 云 数 1、发现那些被忽视的优秀员工或落后员工。 方 2、辅助管理者优化自身决策模式。 3、引导员工行为向“更好的”、“企业需要的” 方向发展。 22

23.SVM算法构建评价模型原理 领导对员工打分 训练 营 理 数据 发 监督学习模型 研 管 员工行为数据 数 字 化 下一期 预测未来的 员工行为得分 方 云 员工行为数据 模型训练 员工评价 输出结果 23

24.模型训练是重点,而“数据”是重中之重 训练 营 发 管 理 字 化 研 方 云 数 数据准备 ·建立数据池 模型建设 ·模型降维,定位关键指标 ·区分训练与测试数据集 ·生成算法,识别结果 ·分析数据特征 ·数据归一化 ·验证算法有效性(自测、互测) 24

25.构建数据池 数据池:28名员工的2020年1-4月行为数据+领导打分。 训练 营 数据包括研发人员。 发 管 理 字 化 研 云 数 数据来源为研发管理系统TAPD、Sonar、考勤系统等。 方 数据经过清洗,将不合格数据筛除,得到48个维度的数据。 25

26.区分训练与测试数据集 基于A企业员工4个月行为数据和每月领导打分数据 训练 营 月份 训练算法 标签 发 管 理 测试集 1月 SVM 字 化 研 有 2、3、4月行为数据与label 方 2月 云 3月 数 SVM SVM 有 有 1、3、4月行为数据与label 1、2、4月行为数据与label 4月 SVM 有 1、2、3月行为数据与label 26

27.第一次全量指标实验 - 失败 指标选择:全量指标(48个) 指标过多 + 训练样本过少 输入数据:4月训练模型,1月测试模型。 训练 营 导致模型受过多因素影响,无法有效区分出优秀人员 理 二分目标:“好” ,“不好” 参数:gamma=0.2,kernel='rbf',C=15 研 发 管 数 学习数据 (4月) 字 化 验证数据 (1月) 方 云 主管评价 不好 好 主管评价 不好 好 数量 24 4 数量 23 5 验证结果:4月模型识别1月数据,好员工为0,验证未通过。 27

28. 模型降维:RandomForestRegressor 营 算法降维 模型降维后指标库 基于实验2所使用的48个指标,通过机器学习算法 1 理 训练 代码提交行数 ( RandomForestRegressor ),筛选出有效指 研 发 管2 3 任务完成总时长 缺陷评分 化 标8个。 字 4 任务速度 方 云 人工降维 数 5 6 个人需求速度 任务平均完成时长 7 个人投入 可以根据业务解读,管理经验等⼈⼯⽅式再去评 8 任务预估工时准确率(组织) 价这些有效变量。 28

29. 生成算法,识别结果 4月份,28名研发人员,8个指标,优秀与非优秀数据对比 营 任务预估工时准 练 姓名 类别 代码提交行数 任务完成总时长 缺陷评分 任务速度 个人需求速度 任务平均完成时长 个人投入 确率(组织) 赵同学 张同学 优 优 25624 2107 338.05 446.8 1.5 3.3333 管 理 0.2075 0.1751 0 25.04 训 37.5611 44.68 133.4 127.6 44.4444 60 发 蔡同学 优 141427 795.85 0.4848 0.1577 0 49.7406 133.4 81.25 霍同学 优 94246 628.35 1.6667 0.1865 114.355 41.89 95.52 46.6667 研 于同学 差 0 53.76 0 1.2547 0 5.376 14 90 化 赵同学 差 0 342.07 0 0.1604 0 48.8671 43.2 85.7143 字 王同学 差 638 0 0 8 0 0 43.5 0 数 周同学 差 1327037 274.5 0 0.2812 17.44 27.45 52.2 20 1. 方 云 4月的优秀标准: 代码提交多 4月研发人员优秀的标准在于 打硬仗的、肯付出(处理缺陷,持续输出) 2. 处理缺陷,尤其是复杂缺陷。 3. 个人投入多 4. 任务完成时长偏长,处理棘手问题 降维后模型有效性: 89.3%,与48指标模型判断准确率相同(4月训练、4月验证) 29

方云数据:方云孵化于收单行业领军品牌随行付研发团队,深度打磨研发管理数据工具,支撑企业实现飞速增长。目标将企业研发绩效全部客观的进行数字化评价,以经营视角展现研发效能,合理调配研发资源。帮助技术决策者精确测评研发组织绩效(便于向上汇报、平级沟通)和个人绩效(便于向下管理)。