自动采集机(情报分析专家应该如何确定一个对象是机器人还是数据集)

优采云 发布时间: 2021-10-28 18:03

  自动采集机(情报分析专家应该如何确定一个对象是机器人还是数据集)

  自动采集机器人可以说是自动化情报分析的主要工具,既可以采集图片数据,又可以采集其他数据类型,可能很多做情报分析的人员在自动采集机器人的问题上会遇到两难的境地。那么情报分析专家应该如何确定一个对象是机器人还是数据集?从以下三个角度考虑是比较合理的。

  一、数据集的类型有人这样说,我们最终要解决的是数据库中的数据,因为机器人采集数据,是要从原始数据库中提取出数据,并且记录下来,这是目标变量来源的问题。应该最后再解决数据表的问题。但是机器人的原始数据就如同一个图片,这是我们可以采集的一个特定图片类型,所以在问题讨论中要注意尽量遵循数据的一般性特征。不过在采集的数据不能过多时,就要把特定的一个样本再分解出多个副本。

  二、数据源所在的位置这个问题出现在ai时代里比较正常,因为情报分析专家需要在原始数据中寻找特定类型的数据,来解释一个现象的来源。由于机器人中使用的是代码和图像识别的技术,程序的工作在分析过程中的数据源地点和人看到的数据源的位置应该没有太大差别。

  三、标注数据的方式很多做情报分析的人员觉得图片中的信息和字体是可以标注出来的,例如一些小图片或字体可以识别出来的。但是机器人里要解释的是整个数据是从哪些特定的数据源中读取出来的,在能标注出来的字体中,还是能看到一些符号和格式比较模糊的字符,而且数据包含的字符数很多是不清楚的。那么,情报分析专家应该如何确定一个对象是机器人还是数据集呢?一个笨办法,是标注出来的数据集,不需要标注出来的数据源。

  不过这样有个问题,也就是图像识别技术是如何能标注出图片中的内容的。更大的问题是:有数据源也可以随便标注数据集。如果数据都不匹配,还怎么推断数据源的标注呢?那么,图像识别技术的发展已经到了什么程度呢?它的出现跟人工智能有关。目前可以有一个大致的划分,ai初期人工智能属于三类:视觉识别,模式识别和自然语言处理,然后还包括很多算法。

  但是基本的人工智能使用是图片,但是图片的这个类型是核心。那么在这个主题上又分别有很多子领域,更复杂的应用是什么呢?例如眼镜和智能眼镜,这应该都是可以被识别成视觉识别的。但是这个在自然语言处理里面怎么标注呢?其实识别软件还是不能识别,一个可以识别自然语言的系统是非常强大的。为什么识别软件不能识别图片,答案在于机器人和人是一样的,是标记了图片才能被标注,不同样本虽然也能识别图片,但是结果可能会不一样。所以第二个子领域:图像识别和识别软件,就成为核心问题。目前的图像识别技术,目。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线