经验:物体识别算法,每一种类别需要多少标注样本支撑才是足够的,有没有成熟的理论?

优采云 发布时间: 2022-10-02 06:13

  经验:物体识别算法,每一种类别需要多少标注样本支撑才是足够的,有没有成熟的理论?

  从本质上讲,这个问题可以分为两个大问题:

  样本不平衡问题的数据增强方法

  因此,如果想深入研究这个问题,可以参考相关方向的论文(后面会给出链接,待补)

  说说我的个人经历,请指正:

  

  场景一:如果你面对的场景已经有比较大的数据集,而你需要的类别不包括在内,比如自然场景中的物体检测,可以从COCO、PASCAL VOC等进行预训练,模型可以是微调。在训练过程中,确保你的新类别与原创数据集中的原创类别以 1:1 的比例持续训练。这个过程需要防止过拟合,需要根据真实的数据分布来考虑数据。ratio、简单的数据增强策略、水平/垂直翻转、添加噪声等可以在训练过程中随机增加一部分样本(需要实际操作验证是否对您的数据有效)

  场景 2:您面临的场景没有可以使用的外部数据。一种方法是学习爬虫技术,scrapy各种框架,爬到你需要的数据,相信没有免费的午餐!!!,

  1) 如果你的场景可以通过合成获得数据,那么这就是考验你想象力的时候了。比如你要做一个字符识别(OCR),你需要考虑各种字体、字体大小、背景、旋转、字体布局等。想了想,开始使用opencv等工具制作数据自己设置,很容易达到你想要的规模。

  2) 对于复杂的场景,现在看来推荐用GAN来补全。是的,我也面临数据不足的问题。我将尝试合成产品数据。效果好不好还不得而知。欢迎完善参考文献(待填)

  

  听上采样、下采样、图像看物体检测相关论文的具体实现。

  1) 正如SSD模型中提到的,一个好的数据增强方法可以大大提高检测效果。有关详细信息,请参阅:SSD:Single Shot MultiBox Detector

  其他:

  zero-shot,low-shot learning,一个非常新的方向,见 FAIR 的论文:Low-shot Visual Recognition by Shrinking and Halucinating Features

  通用方法:光年SEO日志分析系统使用方法

  Lightyear SEO日志分析系统是一个网站日志分析工具。光年SEO日志分析系统可以分析IIS和apache文件日志,软件可以有效分析SEO数据。下载使用。

  特征

  光年日志分析工具,又称网站日志分析软件,可以分析iis、apache等日志,是站内必备工具。这对于大文件日志也非常强大。

  

  这是第一款专为SEO设计的日志分析软件。很多以前的日志分析软件都是顺带分析SEO数据的,而且这个软件分析的每一个指标都是针对SEO设计的,很多分析维度是其他日志分析软件所没有的。

  光年日志分析工具可以让你看到很多以前看不到的非常有用的数据,可以分析无限大的日志,而且速度非常快。

  文件地址

  指示

  一、下载并打开软件,点击左上角的文件进行添加。

  

  二、添加日志文件,点击下一步。

  三、添加后点击开始分析。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线