高性能计算与天文学

下载 6

献良

发布于

2549

人观看

#信息技术

超级计算机如何进行高性能计算优化？浪潮对天文学HPC应用的相关积累，包括典型案例分享：SKA平方公里阵列射电望远镜，现代发展中的天文学在大量使用数据挖掘、机器学习和人工智能，如何发挥超级计算机的计算性能？文章中对超级计算机软硬件和应用场景都进行的剖析分解。

展开查看详情

1 .高性能计算与天文学应用优化陈俊博士浪潮应用支持团队

2 .Contents 如何进行高性能计算应用优化？浪潮对天文学 HPC 应用的相关积累典型案例分享： SKA 平方公里阵列射电望远镜发展中的天文学：数据挖掘、机器学习和人工智能

3 .如何进行 HPC 的应用优化？

4 .科研计算需求浪潮应用支持团队程序性能深度分析报告更快优化建议经济更强计算能力；更少节点绿色能耗更低复杂问题数值计算大批量数据处理不同种类程序和大量自研程序在业界流通更快的计算速度更好的拓展性更有效利用硬件资源更新的 CPU 架构异构计算加速 GPU 、 FPGA… 高速网络通信先进的存储系统

5 .优化方法论硬件优化软件改进 GPU / KNL / KNM FPGA 异构加速算法设计代码重构算法创新技术架构革新系统平台优化循环迭代

6 .HPC + Big Data Memory Hard Drive Accelerator 数据中心级节点级微架构级支持 : > 1024 节点资源占用 < 0.3% 系统级信息内存 \PCI-E\ 网络 \ 数据读写带宽 , IOPS, 数据传输微架构性能优化 x87\AVX\SSE \ 指令集，向量化率 , CPI Processor 专业研究工具

7 .~10 行业白皮书 ~20 应用性能分析白皮书 >100 基准测试报告 Sandybridge Ivybridge Haswell Broadwell Skylake GPU FPGA MIC KNL KNM Infiniband OmniPath Ethernet Lustre BeeGFS GPFS NFS Processor Accelerator Network Storage 经验积累

8 .经验积累 ~20 研究领域 ~300 应用种类 ~900 应用程序 ~100 深度分析报告

9 .3000 个碟状天线，每个天线直径 15 米，接收器面积合计达 1 平方公里典型案例：平方公里阵列射电望远镜（ SKA ）

10 .平方公里阵列射电望远镜（ SKA ） 10 个工作包 - 系统集成 (AIV) - 中央信号处理器 (CSP) - 天线 (DSH) - 基础设施 (INF) - 低频阵列 (LFAA) - 中频阵列 (MFAA) - 信号与数据传输 ( SaDT ) - 科学数据处理 (SDP) - 望远镜管理 (TM) - 宽带单像素馈源 ( WBSPF )

11 .浪潮参与 SDP 情况 SDP 国际联盟参与计算平台任务计算部件、存储等每两周一次网络视频会议 50 次承担关键软件优化任务 SDP 中方联盟牵头计算平台任务 SKA Telescope Science Data Procesor (SDP) Project Inspur

12 .SKA 高性能应用特点数据量庞大覆盖频率 70~10000MHz 3000 个天线碟型阵列高频每秒 1600 亿比特数据中、低频大量数据计算能力需求 >1000P Top1 太湖之光约 125P Top2 天河二号约 55P

13 .SKA 数据处理流程庞大的观测数据：高频蝶形阵列每秒产生 1600 亿比特， 18.6TB 的数据，加上中低频数据。庞大的计算能力：需要每秒运行速度 1000PFlops 。

14 .浪潮工作产品树开发 SKA 初步设计审阅 Gridding 软件优化 ASC2015 世界超算大赛与 SKA https://confluence.ska-sdp.org/display/COMP/Gridding Inspur

15 .152 支队伍 , 5 大洲 135 所大学 : 清华大学 , MIT , … ASC15 世界超算大赛与 SKA ASC15 最佳优化结果（ Gridding ）使用 24 核 CPU （ E5-2692v2 ）相比单核实现接近 60 倍加速向量化；任务并行化；数据对齐 …

16 .应用优化和特征分析的经验 Solutions

17 .Gridding 需求及解决方案科研业务需求：数据量巨大内存需求大计算量大 SKA 针对化高性能解决方案：专业级的直连存储 + 并行文件系统大内存服务器或胖节点单节点最高可达 6TB 内存综合性能最优的 Intel CPU 系统的高稳定性内存密集型；存储密集型；

18 .浪潮高性能 — 面向百亿亿次 (E 级 ) 计算的整体能力平方公里阵列射电望远镜（ SKA ）世界最大的天文望远镜合作项目浪潮为项目全球唯一超算厂商面向 E 级超算架构研究联合先进厂商浪潮 INTEL 并行计算联合实验室浪潮 NVIDIA 云超算应用创新中心面向 E 级超算应用优化发展和分析调优理论与工具理论 / 算法革新技术架构创新 MIC/GPU/FPGA 系统平台优化 CPU/Mem/IO/Net/OS/ Mgt / Schd 面向 E 级超算应用开发参加国际合作

19 .中国高性能计算机 Top 100 冠军浪潮 46 套高性能集群上榜世界 Top 500 list Top 3 浪潮 56 套集群上榜 2017 年 11 月最新数据

20 .天文学的发展从一个组独立研究的领域，发展为一个大数据、大组织的领域从关注某一类特殊天体进行研究，发展为高精度大范围巡天等研究任务；使用 GPU 进行 Nbody 模拟与人工智能 AI 的相结合对庞大观测数据进行数据挖掘、模式识别和机器学习利用有标签数据训练 AI 对行星分类

21 .浪潮高性能服务人工智能计算领先的硬件平台强大的应用能力完善的生态环境浪潮人工智能计算平台 2/4/8 卡 GPU 平台 /KNL 平台 /FPGA 平台互联网人工智能应用合作百度无人驾驶汽车阿里智能 ” 店小二 ” 科大讯飞智能语音识别打造人工智能生态环境人工智能并行深度学习框架 Caffe-MPI KEEP 平台，深度学习 KNL 训练营 AI Station ，人工智能管理调度软件

22 .高性能计算平台系统拓扑图存储部分：并行文件系统 + 存储备份一体机下载系统：与前端数据采集设备之间保持高速互联。网络系统： 100Gb~200Gb 高速互联网络服务系统：管理节点、登录节点计算系统：刀片、高密度等通用计算节点模块化、 2 路服务器等异构计算节点管理网络：万兆 + 千兆互联管理平台： Cluster Engine 应用优化：应用测试、系统移植、调优、 GPU&MIC 移植等。

23 .Purley 平台 CPU Pascal 架构、 Volta 架构 GPU 100-200G b 最新方案平台重点 AVX512 向量位宽（浮点运算次数从 16 升级到 32 ） U PI 提升至 10.4GT/s 内存通道从 4 升级到 6 ，提升 50 % 内存频率从 2400 升级到 2666 MHz 节点之间通信带宽 200Gb 端到端延迟 0.7μs 以下支持 RDMA ，提升 GPU 通信效率完整的网络拓扑方案 2U8 卡，可选 NVlink 或 PCIe 两种 P100 GPU 卡，配置更灵活 NVlink 高速互联技术，保证每块 GPU 卡之间 P2P 通信速率，并支持 NVlink 2.0 25GB/s 单向通信带宽纯异构集群， Green500 有力竞争者

24 .Thanks for your attention Furthur Information: chen_jun@inspur.ccom 18611768812

9点赞

3收藏

6下载