基于申威众核处理器的HOG特征提取算法并行加速-学术咨询网
计算机工程与科学

计算机工程与科学杂志

  • 北大期刊
  • CSCD
  • 统计源期刊
  • 知网收录
  • 维普收录
  • 万方收录
基本信息
  • 主管单位:

    国防科技大学

  • 主办单位:

    国防科技大学计算机学院

  • 国际刊号:

    1007-130X

  • 国内刊号:

    43-1258/TP

  • 创刊时间:

    1973

  • 期刊类别:

    计算机期刊

  • 出版社:

    计算机工程与科学

  • 主编:

    王志英

  • 发行周期:

    月刊

出版信息
  • 审稿周期:

    1-3个月

  • 被引次数:

    19216

  • 邮发代号:

    42-153

  • 全年定价:

    ¥796.00

  • 他引率:

    0.9643

  • 邮编:

    410073

期刊详情 投稿咨询 关注公众号

基于申威众核处理器的HOG特征提取算法并行加速

作者:赵美婷,刘轶,刘锐,宋凯达,钱德沛,
关键词:
摘要:HOG特征是一种简单高效的常用来进行物体检测的特征描述子,广泛应用于行人检测等领域,然而在处理海量图片时却面临着严峻的性能挑战。解决方法之一就是通过使用&ldq

HOG特征是一种简单高效的常用来进行物体检测的特征描述子,广泛应用于行人检测等领域,然而在处理海量图片时却面临着严峻的性能挑战。解决方法之一就是通过使用“神威太湖之光”超级计算机的处理器节点对海量图像背景下的行人检测算法进行加速。主要采用了两种并行方案:一种是一个处理器同时处理4张图片,另一种是同时处理256张图片。大量的串行和并行处理的实验测试结果表明,对高分辨率多幅图像的并行处理可采用第一种方案,加速比可达83倍;对低分辨率图像可采用第二种方案,加速比最高可达到95。两种并行设计方案在“神威太湖之光”的多处理器节点上具有很好的可扩展性能。


HOG features are a simple and efficient feature descriptor commonly used for object detection. It is widely used in pedestrian detection and other fields. However, they face severe performance challenges when dealing with massive images. One of the solutions is to speed up the pedestrian detection algorithm in the context of mass images by using the Sunway SW26010 processor nodes of the SunwayTaihuLight supercomputer. We propose two methods of parallel implementation: one method is that a processor processes 4 images simultaneously, and the other is that 256 images are processed at the same time. Through a large number of serial and parallel processing experimental tests, the results show that  the first parallel implementation method can be used to process highresolution images and the speedup can reach up to 83; the second parallel implementation method can be used to process lowresolution images and the maximum speedup is 95. The results on multinode processors show that our parallel implementation methods have good scalability. 
相关文章
[1]冯赟龙,刘勇,何王全. 一种基于深度学习的性能分析框架设计与实现[J]. 计算机工程与科学, 2018, 40(06): 984-991.
[2]李金才 龚西平 赵文涛. 数值天气预报全球谱模式并行计算研究[J]. J4, 2004, 26(11): 71-74.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社