虽然二进制神经网络(BNNs)推理例程的硬件实现很多,但目前适合物联网(IoT)边缘设备的高效BNN硬件训练加速器的实现还有很多不足之处。传统的BNN硬件训练加速器执行前向和后向传播,参数采用二进制表示,优化采用浮点或定点实值表示的参数--需要两套不同的网络参数。在本文中,我们提出了一种对硬件友好的训练方法,与传统的方法不同,这种方法可以逐步将一组奇异的定点网络参数二值化,从而显著降低功耗和资源利用率。我们使用英特尔FPGA SDK for OpenCL开发环境在OpenVINO FPGA上训练我们的渐进二值化DNNs。我们使用CIFAR-10在GPU和FPGA上对我们的训练方法进行了基准测试,并与传统的BNNs进行了比较。
打赏帖 | |
---|---|
【瑞萨RA2E1开发板】:使用ADC功能实现位移传感器采集方案被打赏20分 | |
【nRF7002DK】基于sht30的温湿度计被打赏20分 | |
【nRF7002DK】日志打印被打赏20分 | |
rtthread硬件加密-5hash加密分析被打赏10分 | |
【STM32F769】SD卡驱动及其调试经验分享被打赏32分 | |
【分享开发笔记,赚取电动螺丝刀】使用看门狗降低系统隐藏bug触发概率被打赏18分 | |
【STM32F769】调试SD驱动,由于其时钟配置不对引起的错误以及排查记录被打赏35分 | |
【分享开发笔记,赚取电动螺丝刀】MCUXpressoConfigTools配置外设时的异常解决被打赏24分 | |
C语言函数宏的三种封装方式被打赏50分 | |
【换取手持示波器】NUCLEO-F429ZI Mongoose移植被打赏30分 |