事实:自动采集机器人我觉得可以用爬虫来做实验操作

优采云 发布时间: 2022-10-28 21:00

  事实:自动采集机器人我觉得可以用爬虫来做实验操作

  自动采集机器人我觉得可以用爬虫来做实验操作。我们用的是pythonautomator来做爬虫采集:,这样的话你采集的数据是定量的,

  

  你是想采集商品评论里的一句话还是商品评论里的一个评论?评论的话我觉得很难做出来,因为有些商品评论实在太长了。但不是说不可以,你可以把商品评论的词和评论里的关键词结合在一起,这样可以满足我的要求。如果你要做得更精确的话,那就是搜索了。你还可以用语音识别来采集对应的词语和对应的对应的关键词。这一点的难度就比较大了。

  

  因为现在平均使用率低的词语,如果你采集的话可能出现问题。需要知道一个大的数据库来存储,以便于未来数据库更新。最近有一个阿里云的小程序很不错,叫淘评,你可以在里面用语音识别采集商品评论信息,据说是很精准的。你可以下载体验一下。

  光是这句话真的是太难以理解了。商品评论很多是长篇分条。不知道你是想采集商品描述里的话,还是淘宝买家的评论。如果你是想采集淘宝买家的评论,需要采集那个买家的记录。这个基本很难。如果是想采集商品评论里面的话,需要将那句话拆分成子句,所以你采集不了一段话。最好先搜索一下是不是没有或者比较难找到相关的记录。如果找到相关的记录,就根据原文对应长度取几个子句采集到服务器里,像对待一篇论文一样对待你所要采集的数据。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线