智能采集组合文章(AuTopAuTop战队开源算法讲解(六)Openart识别方案介绍)

优采云发布时间: 2021-12-21 11:13

　　本文为第十六届智能汽车智能视觉组-上海交通大学AuTop团队开源算法讲解第7部分-三岔数字识别、专栏及开源程序链接：

　　llo：第十六届智能汽车智能视觉组-上海交通大学AuTop团队开源总结

　　在上一篇文章（木野：第十六届智能汽车智能视觉组-上海交通大学AuTop团队开源算法讲解（六）Openart识别解决方案）中，我们提到了数字化的思路识别，使用全局分类器的方法，直接判断图像中是否有数字目标卡片和对应的数字编号，省略了找框的步骤，不仅计算速度更快，还减少了不稳定因素（ OpenMV 的 find_rect 函数不稳定）

　　模型结构

　　先放一张模型结构的概览图（有点长）用Netron来画。

　　数字分类模型概览图

　　可以看出模型主要由4个子模块组成

　　下采样和正则化 MaxPooling2D+SpatialDropout2D 空间注意力单元：x*sigmoid(conv(x)) 分类头：GlobalMaxPooling2D+Dense

　　另外，模型的代码中使用了超参数width来控制模型的宽度。经过不同参数的选择测试，发现当width=0.5时，可以在计算速度和模型精度之间取得较好的平衡。具体代码实现见开源代码库。

　　2. 数据集生成

　　由于官方只提供了十张标准数码图片，所以数据量有点小。但是如果直接使用OpenArt-mini采集的实际数据，不仅工作量大，而且背景单一，更换场地后识别效果可能会下降。因此，我们以COCO开源数据集为背景，将标准数码图片随机映射到背景图片上，结合数据增强方法生成数据集。可以在最大限度地减少人力的同时训练出性能优异的模型。

　　示例图片

　　示例图片

　　3. 模型训练

　　训练步骤基本参考官方训练方案，只用自己搭建的模型替换模型。仅将数据增强得到的图像作为训练集，少量记录数据作为测试集。两个数据域存在一定的差异，可以更好地看出模型和数据增强的有效性。在我们的实验中，在测试集上可以轻松达到90%以上的准确率，充分证明了该方法的有效性。

　　SJTU-AuTop 完整的开源解决方案链接，如果您觉得我们的解决方案对您有帮助，请帮我在github上给个star :)

　　llo：第十六届智能汽车智能视觉组-上海交通大学AuTop团队开源总结

0

2021-12-21

智能采集组合文章

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

智能采集组合文章(AuTopAuTop战队开源算法讲解(六)Openart识别方案介绍)

0 个评论

发起人

AI时代内容工厂

智能采集组合文章(AuTopAuTop战队开源算法讲解(六)Openart识别方案介绍)

0 个评论

发起人

相关问题