申请试用
HOT
登录
注册
 
异构集群上的宏基因组基因聚类优化

异构集群上的宏基因组基因聚类优化

献良
/
发布于
/
2116
人观看
全基因组将环境基因纳入了基因关联分析的范畴,将环境中的基因组按照样本特征进行聚类,进而研究疾病与某些特定基因聚类的关系,特点是样本数量达数千量级,基因数量可达千万量级,涉及大量浮点迭代运算,在单线程处理器上处理一千样本和一千万基因大概需要27年,加速卡技术与异构集群技术日趋完善,尤其是GPU提供了大量硬件线程、延迟隐藏技术以及低功耗的单位计算为计算的高度并行化创造了条件。相关性系数计算是基于距离的聚类算法共有的特性,因此对相关性系数计算进行并行化对优化聚类算法具有借鉴意义。经过一系列优化,以单节点16线程版本为性能基准,我们在16个CPU节点上获得了15.52倍的性能提升,在6个GPU节点上获得了17.14倍的性能提升。
6点赞
2收藏
0下载
确认
3秒后跳转登录页面
去登陆