黄晶毕业答辩 - 嵌入式与网络计算湖南省重点实验室

异构多核体系结构的嵌入式系统中的性能与能量优化 ... 嵌入式系统结构的复杂化 .... 第三次:在ARM板子上反编译,发现同样的代码,ARM编译出来的汇编与Intel不 ...
展开查看详情

1.异构多核体系结构的嵌入式系 统中的性能与能量优化 答辩人:黄晶 指导老师:李仁发教授

2.目录 研究背景与意义 定频模式下的性能优化 变频模式下的能量优化 性能与能量的联合优化 结论及进一步工作

3.演讲进程 研究背景与意义 定频模式下的性能优化 变频模式下的能量优化 性能与能量的联合优化 结论及进一步工作

4.研究背景与意义 日常生活 医疗 军用 手机 MP3 数字相机 平板 智能医疗设备 可穿戴设备 军用设备 嵌入式应用 汽车电子 航空电子 交通 嵌入式应用已广泛应用

5.研究背景与意义 需求多样化 + 功能复杂化 嵌入式系统结构的复杂化 2002 Volvo XC90 1927 年控制系 统

6.研究背景与意义 性能与能量是两个基本要素 反应太慢了 又没电了… … 充电 5 分钟 玩得流畅 ,通话 2 小 时 性 能 能 量 现在嵌入式系统设计考虑因素 1 、如何提高性能 2 、如何节约能量

7. 研究背景与意义 现在复杂嵌入式系统的特点 Instrumental ECU Cabin ECU 多核:由多个计算单元组成 Engine ECU 体 系 异构:各节点可能其结构不一样 结 构 Vehicle ECU Transmission ECU 分布:物理位置各异 应 任务异构:包含多类任务,每类任务的职责、到达率,大小、重要性各异 用

8.研究背景与意义 负载均衡与能量有效需要考虑的问题 1 、不平衡的初始状态: 系统里有些任务是被固定分配在某个节点上执行,不能随意迁移。因此,各个 节点有可能已经分配了一定的专属任务,由于不同专有任务之间存在差异性, 比如任务的大小、任务量的多少等,在未进行负载均衡前系统已经处于不平衡 状态。 2 、混合优先级策略: 系统包含多种任务,重要任务与普通任务的执行顺序有优先之分。但每类 任务的重要性也有高低之分,所以为得到高资源利用需根据任务的重要性 为每个节点设置适当的优先级调度策略。 3 、满足不同类型任务的性能 从嵌入式系统的角度考虑,既要保证普通任务的性能又要保证专有任务 的性能 4 、处理器的异构性。 多核系统中每个处理单元的型号甚至生产厂家不同,导致处理单元见体系 结构可能不同,从而不同处理器可能有不同的动态能量消耗级别与静态能 量消耗级别,即使运行频率一样的情况下。

9.研究背景与意义 系统与任务抽象 异构多核分布 n 个异 普通任务 构处理 器 重要任务 普通任务 专属任务

10.研究背景与意义 研究内容 1 问 定频模式下的性能优化 题 2 问 变频模式下的能量优化 题 负载均衡 + 能量有效 3 问 性能与能量的联合优化 题

11.相关研究 设计高性能、低功耗嵌入式系统的框架

12.演讲进程 研究背景与意义 定频模式下的性能优化 变频模式下的能量优化 性能与能量的联合优化 结论及进一步工作

13.演讲进程 研究背景与意义 定频模式下的性能优化 变频模式下的能量优化 性能与能量的联合优化 结论及进一步工作

14.定频模式下的性能优化 Motivation 频繁地改变处理器的频率和电压会严重影响处理器的寿命,因此在很多 大型的计算机里,并不主张高频率地改变处理器供电电压与频率,而是 从系统生态的角度选择合适的频率长期运行。性能与能量都是非常重要 的指标,在有些系统里侧重于性能,而有些系统里可能更侧重于能量节 约,本章研究内容围绕不切换处理器工作频率下的情况下,研究能量约 束的性能优化问题。 普通任务 n 个异 构处理 固定能量优 器 化性能 专属任务

15.定频模式下的性能优化 模型 基础模型 排队论(任务的到达、等待、处理是一个排队过 程,且具有一定的随机性) M/M/ 1 普通任务 能量表示 所有处理器所消耗的 能量之和 性能表示 每个队列系统中普通任务 的平均响应时间的 加权平均和(先不考虑专 属任务) 专属任务

16. 定频模式下的性能优化 性能模型 PS1:“ 专属任务无优先级” 专属任务与普通任务之间没有伯仲之分,所有的任务都按到 达系统的先后顺序排队执行。也就是说专属任务相对普通任 务而言无调度的优势。 PS2: “ 专有任务优先级不抢占” 只要系统的等待队列中有专属任务与普通任务,那么专属任 三种优先级 性能 务总是会在普通任务之前优先执行。但是如果当队列中已经 有一个普通任务在被执行了,那么在执行的过程中,如果有 专属任务的达到,在这种情况下专属任务也需要在等待队列 中等待当前任务执行完毕再按被执行。 PS3: “ 专属任务优先级抢占” 当系统的等待队列中同时存在专属任务和普通任务的时候, 专属任务总是会在普通任务之前先调度。而且当队列中有普 通任务在被执行时,如果此时有一个专属任务到达队列,那 么系统必须把当前正在执行的普通任务取消或挂起,直到系 统中不存在专属任务的时候再重新执行。

17. 定频模式下的性能优化 能量模型 CMOS 动态 静态 短路 消耗 消耗 消耗 k: 相关系数 C: 负载电容 V: 供电电压 P  kCV 2 f f: 时钟频率 S :处理器每秒可执行的指令 数 s f, f  V 约为  3. P  s P* 每个核能量 Pi  sii  Pi *

18. 定频模式下的性能优化 问题描述 已知条件 普通任务 n 个嵌入式核 v1 , v2 ,K , vn ° 1 , ° 2 ,K 专属任务的到达率 , ° n M/M/ 1 专属任务的指令数 r%1 , r%2 ,K , r%n 普通任务的到达率  $ 普通任务的平均指令数 r$ 系统可用能量 P 专属任务 所求目标 $以及每个核的速度 求每个节点上所应承担的普通任务的子流  i si (1  i  n) 普通任务的平均响应时间最小 T 约束条件 $  µ  1 $1Tµ 1  $2 Tµ 2  K  $n Tµ n  n P 一、能量:    sii  Pi  P  $  二、隐含: $1  $2  L  $n i 1

19.定频模式下的性能优化 问题求解 求解方法:拉格朗日 求 2n+2 个变量:

20.定频模式下的性能优化 问题求解 求解思路:设

21.定频模式下的性能优化 问题求解 最终解决问题的思路

22.定频模式下的性能优化 数值实验 负载异构对性能优化的影响 不同 α 对性能优化的影响 优先级调度策略对性能优化影响 完全异构系统测试 普通任务 M/M/ 1 专属任务

23.定频模式下的性能优化 贡献 充分结合异构、分布、嵌入式计算的特定考虑性能优化的问题 提出一个可得全局最优性能的优化算法 利用算法分析了不同参数对异构分布式系统最优负载与能量分配的影响 《 Journal of Parallel and Distributed Computing 》 审稿中

24.演讲进程 研究背景与意义 定频模式下的性能优化 变频模式下的能量优化 性能与能量的联合优化 结论及进一步工作

25.演讲进程 研究背景与意义 定频模式下的性能优化 变频模式下的能量优化 性能与能量的联合优化 结论及进一步工作

26.变频模式下的能量优化 Motivation 在能量敏感的系统中,通常要求尽可能地减少系统能量消耗,因此很多 设计者通常以满足性能需求的前提下的把最少能量使用作为设计目标。 减少系统能量既要降低处理器忙时的能量开销也要减少处理器闲时的 能量浪费。减少处理器忙时的能量通过降低处理器功率的方式获得 ; 减 少闲时能量消耗,通过降低处理器不工作时的频率或电压的方式获得。 普通任务 n 个异 构处理 固定性能优 器 化能量 专属任务

27. 定频模式下的性能优化 能量模型 CMOS 动态 静态 短路 消耗 消耗 消耗 k: 相关系数 C: 负载电容 V: 供电电压 P  kCV 2 f f: 时钟频率 s f, f  V 约为  3. P  s P* 工作时的速度为 S i si  Pi * 空闲时的速度为 SIi sIii  Pi * 单位时间内处理器的工作时间为: i 不工作时间为: 1  i 能量模型     P  sii  Pi * i  sIii  Pi *  1  i 

28. 变频模式下的能量优化 性能模型 PS1:“ 专属任务无优先级” 专属任务与普通任务之间没有伯仲之分,所有的任务都按到 达系统的先后顺序排队执行。也就是说专属任务相对普通任 务而言无调度的优势。 PS2: “ 专有任务优先级不抢占” 只要系统的等待队列中有专属任务与普通任务,那么专属任 三种优先级 性能 务总是会在普通任务之前优先执行。但是如果当队列中已经 有一个普通任务在被执行了,那么在执行的过程中,如果有 专属任务的达到,在这种情况下专属任务也需要在等待队列 中等待当前任务执行完毕再按被执行。 PS3: “ 专属任务优先级抢占” 当系统的等待队列中同时存在专属任务和普通任务的时候, 专属任务总是会在普通任务之前先调度。而且当队列中有普 通任务在被执行时,如果此时有一个专属任务到达队列,那 么系统必须把当前正在执行的普通任务取消或挂起,直到系 统中不存在专属任务的时候再重新执行。

29. 变频模式下的能量优化 问题描述 已经条件 普通任务 n 个嵌入式核 v1 , v2 , K , vn ° 1 , ° 2 ,K 专属任务的到达率 , ° n M/M/ 专属任务的指令数 r%1 , r%2 ,K , r%n 1 普通任务的到达率  $ 普通任务的平均指令数 r$ 系统基本性能需求 T 处理器空闲时的速度 sI 1 , sI 2 ,..., sIn 专属任务 所求目标 $以及每个核的速度 求每个节点上所应承担的普通任务的子流  i si (1  i  n) n 普通任务的平均响应时间最小 P       sii  Pi * i  sIii  Pi *  1  i  约束条件 i 1 1 n $µ 一、性量:  iT i  T $  二、隐含: $1  $2  L  $n $ i 1