智能采集组合文章(AuTopAuTop战队开源算法讲解(六)Openart识别方案介绍)
优采云 发布时间: 2021-12-21 11:13智能采集组合文章(AuTopAuTop战队开源算法讲解(六)Openart识别方案介绍)
本文为第十六届智能汽车智能视觉组-上海交通大学AuTop团队开源算法讲解第7部分-三岔数字识别、专栏及开源程序链接:
llo:第十六届智能汽车智能视觉组-上海交通大学AuTop团队开源总结
在上一篇文章(木野:第十六届智能汽车智能视觉组-上海交通大学AuTop团队开源算法讲解(六)Openart识别解决方案)中,我们提到了数字化的思路识别,使用全局分类器的方法,直接判断图像中是否有数字目标卡片和对应的数字编号,省略了找框的步骤,不仅计算速度更快,还减少了不稳定因素( OpenMV 的 find_rect 函数不稳定)
模型结构
先放一张模型结构的概览图(有点长)用Netron来画。
数字分类模型概览图
可以看出模型主要由4个子模块组成
下采样和正则化 MaxPooling2D+SpatialDropout2D 空间注意力单元:x*sigmoid(conv(x)) 分类头:GlobalMaxPooling2D+Dense
另外,模型的代码中使用了超参数width来控制模型的宽度。经过不同参数的选择测试,发现当width=0.5时,可以在计算速度和模型精度之间取得较好的平衡。具体代码实现见开源代码库。
2. 数据集生成
由于官方只提供了十张标准数码图片,所以数据量有点小。但是如果直接使用OpenArt-mini采集的实际数据,不仅工作量大,而且背景单一,更换场地后识别效果可能会下降。因此,我们以COCO开源数据集为背景,将标准数码图片随机映射到背景图片上,结合数据增强方法生成数据集。可以在最大限度地减少人力的同时训练出性能优异的模型。
示例图片
示例图片
3. 模型训练
训练步骤基本参考官方训练方案,只用自己搭建的模型替换模型。仅将数据增强得到的图像作为训练集,少量记录数据作为测试集。两个数据域存在一定的差异,可以更好地看出模型和数据增强的有效性。在我们的实验中,在测试集上可以轻松达到90%以上的准确率,充分证明了该方法的有效性。
SJTU-AuTop 完整的开源解决方案链接,如果您觉得我们的解决方案对您有帮助,请帮我在github上给个star :)
llo:第十六届智能汽车智能视觉组-上海交通大学AuTop团队开源总结