网页采集器的自动识别算法(CNN被训练来识别来自类似数据集的图像,解决原始问题)

优采云 发布时间: 2021-10-04 01:01

  网页采集器的自动识别算法(CNN被训练来识别来自类似数据集的图像,解决原始问题)

  HSE 大学的一位科学家开发了一种图像识别算法,其工作速度比同类产品快 40%。它可以加快基于视频的图像识别系统的实时处理速度。这项研究的结果已发表在《信息科学》杂志上。

  

  卷积神经网络 (CNN) 包括一系列卷积层,广泛用于计算机视觉。网络中的每一层都有一个输入和一个输出。图像的数字描述进入第一层的输入,并在输出转换为一组不同的数字。结果进入下一层的输入,以此类推,直到最后一层预测出图像中物体的类标签。例如,此类别可以是人、猫或椅子。为此,CNN 在一组具有已知类标签的图像上进行训练。数据集中每个类别的图像数量和可变性越大,训练的网络就越准确。

  如果训练集中只有几个例子,将使用神经网络的额外训练(微调)。CNN 被训练从相似的数据集中识别图像,从而解决了原创问题。例如,当神经网络学习识别人脸或其属性(情绪、性别、年龄)时,它最初被训练从照片中识别名人。然后在现有的小数据集上对生成的神经网络进行微调,以识别家庭视频监控系统中的家庭成员或亲戚的面孔。CNN 中层数的深度(数量)越多,它对图像中物体类型的预测就越准确。但是,如果层数增加,则识别对象需要更多时间。

  

  该研究的作者、Nizhny Novgorod HSE 校区的 Andrei Savchenko 教授能够在他的实验中加速具有任意架构的预训练卷积神经网络的工作。该网络由 90 层组成 - 由 780 层组成。结果,识别速度提高了40%,而准确率的损失控制在0.5-1%。这位科学家依赖于统计方法,例如顺序分析和多重比较(多重假设检验)。

  图像识别问题中的决策是由分类器做出的,分类器是一种特殊的数学算法,它接收数字数组(图像的特征/嵌入)作为输入,并输出关于图像属于哪个类别的预测。可以通过输入神经网络任何层的输出来应用分类器。为了识别“简单”的图像,分类器只需要分析来自神经网络第一层的数据(输出)。

  如果我们对自己做出的决定的可靠性有信心,就没有必要浪费更多的时间。对于“复杂”的图片,第一层显然是不够的,需要去下一层。因此,分类器被添加到神经网络的几个中间层。算法根据输入图片的复杂程度决定是继续识别还是完成识别。Savchenko 教授解释说:“因为在这样的程序中控制错误很重要,所以我应用了多重比较的理论。我引入了许多假设,我应该在中间层停止,并按顺序测试这些假设。”

  如果第一个分类器产生了多假设检验程序认为可靠的决定,则算法停止。如果判定决策不可靠,则神经网络中的计算继续到中间层,并重复可靠性检查。

  正如科学家所指出的,神经网络最后几层的输出获得了最准确的决策。网络输出的早期分类速度要快得多,这意味着需要同时训练所有分类器以在控制精度损失的同时加快识别速度。例如,使因提前停止造成的误差不超过 1%。

  高精度对于图像识别总是很重要的。例如,如果人脸识别系统中的决策是错误的,那么任何外人都可以获得机密信息,否则,用户将因神经网络无法正确识别而被反复拒绝访问。速度有时可以牺牲,但这很重要。例如,在视频监控系统中,非常需要实时决策,即每帧不超过20-30毫秒。Savchenko 教授说:“要在此时识别视频帧中的物体,快速行动而又不失准确性是非常重要的。”

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线