DeepFlame:基于深度学习和高性能计算的反应流模拟开源平台-学术咨询网
计算机工程与科学

计算机工程与科学杂志

  • 北大期刊
  • CSCD
  • 统计源期刊
  • 知网收录
  • 维普收录
  • 万方收录
基本信息
  • 主管单位:

    国防科技大学

  • 主办单位:

    国防科技大学计算机学院

  • 国际刊号:

    1007-130X

  • 国内刊号:

    43-1258/TP

  • 创刊时间:

    1973

  • 期刊类别:

    计算机期刊

  • 出版社:

    计算机工程与科学

  • 主编:

    王志英

  • 发行周期:

    月刊

出版信息
  • 审稿周期:

    1-3个月

  • 被引次数:

    19216

  • 邮发代号:

    42-153

  • 全年定价:

    ¥796.00

  • 他引率:

    0.9643

  • 邮编:

    410073

期刊详情 投稿咨询 关注公众号

DeepFlame:基于深度学习和高性能计算的反应流模拟开源平台

作者:毛润泽,吴子恒,徐嘉阳,章严,陈帜,
摘要:近年来,深度学习被广泛认为是加速反应流模拟的一种可靠方法。近期开发了一个名为DeepFlame的开源平台,可以在模拟反应流过程中实现对机器学习库和算法的支持。基

近年来,深度学习被广泛认为是加速反应流模拟的一种可靠方法。近期开发了一个名为DeepFlame的开源平台,可以在模拟反应流过程中实现对机器学习库和算法的支持。基于DeepFlame,成功地采用深度神经网络来计算化学反应源项,并对DeepFlame平台进行了高性能优化。首先,为了充分发挥深度神经网络(DNN)的加速潜力,研究实现了DeepFlame对DNN多卡并行推理的支持,开发了节点内分割算法和主从通信结构,并完成了DeepFlame向图形处理单元(GPU)和深度计算单元(DCU)的移植。其次,还基于Nvidia AmgX库在GPU上实现了偏微分方程求解和离散稀疏矩阵构造。最后,对CPU-GPU/DCU异构架构上的新版本DeepFlame的计算性能进行了评估。结果表明,仅利用单个GPU卡,在模拟具有反应性的泰勒格林涡(TGV)时可以实现的最大加速比达到15。


In recent years, deep learning has been widely recognized as a reliable approach to accele- rate reacting flow simulations. In recent work, this paper has developed an open-source platform named DeepFlame, which supports machine learning libraries and algorithms during the simulation of reacting flows. Leveraging DeepFlame, this paper has successfully employed deep neural networks (DNNs) to compute chemical reaction source terms. This paper focus on optimizing the platform for high-performance. Firstly, to fully harness the acceleration potential of DNNs this paper implements support for multi-GPU parallel inference in DeepFlame, developing intra-node partitioning algorithms and a master-slave communication structure, and complete the migration to Graphics Processing Units (GPUs) and Deep Computing Units (DCUs). Furthermore, this paper implements the solution of partial differential equations and the construction of discrete sparse matrices on GPUs based on the Nvidia AmgX library. Finally, this paper evaluates the computational performance of the updated DeepFlame on a CPU-GPU/DCU heterogeneous architecture. The results indicate that using a single GPU card alone can achieve a maximum speedup of up to 15 times when simulating a reactive Taylor Green Vortex (TGV). 


相关文章

[1]罗婧, 叶志晟, 杨泽华, 傅天豪, 魏雄, 汪小林, 罗英伟, . 研发类GPU集群任务数据集的构建及分析[J]. 计算机工程与科学, 2024, 46(12): 2128-2137.
[2]王鹏, 张嘉诚, 范毓洋, . 适应于硬件部署的神经网络剪枝量化算法[J]. 计算机工程与科学, 2024, 46(09): 1547-1553.
[3]李猛, 刘姿邑, 宋宇航. 基于双重自表达与最大熵原理的深度子空间聚类算法[J]. 计算机工程与科学, 2024, 46(09): 1685-1692.
[4]辛高枫, 刘玉潇, 张青龙, 韩锐, 刘驰. 边缘侧神经网络块粒度领域自适应技术研究[J]. 计算机工程与科学, 2024, 46(08): 1361-1371.
[5]姜晶菲, 何源宏, 许金伟, 许诗瑶, 钱希福. NM-SpMM:面向国产异构向量处理器的半结构化稀疏矩阵乘算法[J]. 计算机工程与科学, 2024, 46(07): 1141-1150.
[6]吴瑕, 郑洪英, 肖迪. 一种基于认证文件的双方验证模型水印方案[J]. 计算机工程与科学, 2024, 46(04): 647-656.
[7]王宇华, 何俊飞, 张宇琪, 徐悦竹, 崔环宇. DRM:基于迭代归并策略的GPU并行SpMV存储格式[J]. 计算机工程与科学, 2024, 46(03): 381-394.
[8]曹健, 陈怡梅, 李海生, 蔡强, . 基于图神经网络的行人轨迹预测研究综述[J]. 计算机工程与科学, 2023, 45(06): 1040-1053.
[9]马铭苑, 李虎, 王梓斌, 况晓辉. 深度神经网络模型后门植入与检测技术研究综述[J]. 计算机工程与科学, 2022, 44(11): 1959-1968.
[10]张勇, 张曦, 万云博, 何先耀, 赵钟, 卢宇彤. 非结构有限体积CFD计算的网格重排序优化[J]. 计算机工程与科学, 2022, 44(10): 1721-1729.
[11]文敏华, 陈江, 胡广超, 韦建文, 王一超, 林新华. 面向CFD应用的Intel持久内存性能评估[J]. 计算机工程与科学, 2022, 44(09): 1550-1556.
[12]张开生, 赵小芬. 复杂环境下基于自适应深度神经网络的鲁棒语音识别[J]. 计算机工程与科学, 2022, 44(06): 1105-1113.
[13]翦杰, 罗章, 赖明澈, 肖立权, 徐炜遐. 基于深度神经网络的高速信道自适应均衡器[J]. 计算机工程与科学, 2022, 44(04): 605-610.
[14]朱浩, 周博洋, 卢雪山, 杜溢墨. OpenCL计算软件栈评估[J]. 计算机工程与科学, 2021, 43(12): 2105-2114.
[15]杜鹏, 李超, 石剑平, 姜麟. 基于阿当姆斯捷径连接的深度神经网络模型压缩方法[J]. 计算机工程与科学, 2021, 43(11): 2043-2048.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社