在这项工作中,我们提出了一种新的高效的人类动作识别方法,称为视频变换器网络(VTN)。它利用了计算机视觉和自然语言处理的最新进展,并将其应用于视频理解。所提出的方法允许我们创建轻量级的CNN模型,仅使用RGB单摄像头和通用CPU就可以实现高精度和实时速度。此外,我们解释了如何通过从多个具有不同模式的模型中提炼出一个单一模型来提高准确性。我们与最先进的方法进行了比较,表明我们的方法在著名的动作识别数据集上的表现与大多数方法相当。我们使用现代推理框架对模型的推理时间进行了基准测试,并认为我们的方法在速度/精度权衡方面与其他方法比较有利,在CPU上以每秒56帧(FPS)的速度运行。模型和训练代码都是可用的1。
我要赚赏金打赏帖 |
|
|---|---|
| 【S32DS】S32K3 RTD7.0.1 HSE 组件配置报错问题解决被打赏¥27元 | |
| 【S32K3XX】MCME 启动 CORE1被打赏¥23元 | |
| AG32VH407下温度大气压传感器及其检测被打赏¥20元 | |
| AG32VH407下光照强度传感器BH1750及其检测被打赏¥22元 | |
| AT32VH407下使用温湿度传感器DHT22进行检测被打赏¥20元 | |
| DIY一个婴儿澡盆温度计被打赏¥34元 | |
| 【FreeRtos】FreeRtos+MPU region 配置规则被打赏¥23元 | |
| 【分享开发笔记,赚取电动螺丝刀】三分钟快速上手驱动墨水屏(ArduinoIDE)被打赏¥28元 | |
| 【S32K3XX】LIN 通讯模块使用被打赏¥31元 | |
| 【FreeRtos】FreeRtos + MPU模块的配置使用被打赏¥32元 | |
我要赚赏金
