热搜关键词: 数字信号处理RTOSC语言Linux射频电路

pdf

Scalable and modularized RTL compilation of Convolutional Neural Networks...

  • 1星
  • 2021-01-07
  • 3.13MB
  • 需要2积分
  • 0次下载
标签: 卷积神经网络

卷积神经网络

CNN

卷积神经网络

FPGA

卷积神经网络

Scalable  and  modularized  RTL  compilation  of  Convolutional  Neural  Networks  onto  FPGA 

作者:Yufei  Ma,  Yu  Cao,  Jae-sun  Seo,  Naveen  Suda

Despite  its  popularity,  deploying  Convolutional  Neural  Networks  (CNNs)  on  a  portable  system  is  still  challenging  due  to  large  data  volume,  intensive  computation  and  frequent  memory  access.  Although  previous  FPGA  acceleration  schemes  generated  by  high-level  synthesis  tools  (i.e.,  HLS,  OpenCL)  have  allowed  for  fast  design  optimization,  hardware  inefficiency  still  exists  when  allocating  FPGA  resources  to  maximize  parallelism  and  throughput.  A  direct  hardware-level  design  (i.e.,  RTL)  can  improve  the  efficiency  and  achieve  greater  acceleration.  However,  this  requires  an  in-depth  understanding  of  both  the  algorithm  structure  and  the  FPGA  system  architecture.  In  this  work,  we  present  a  scalable  solution  that  integrates  the  flexibility  of  high-level  synthesis  and  the  finer  level  optimization  of  an  RTL  implementation.  The  cornerstone  is  a  compiler  that  analyzes  the  CNN  structure  and  parameters,  and  automatically  generates  a  set  of  modular  and  scalable  computing  primitives  that  can  accelerate  various  deep  learning  algorithms. 

展开预览

猜您喜欢

评论

登录/注册

积分规则

意见反馈

求资源

回顶部

推荐内容

热门活动

热门器件

随便看看

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

 
机器人开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版 版权声明

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2026 EEWORLD.com.cn, Inc. All rights reserved
×