京东商品评价组成部分五、优采云人工流程采集目标

优采云 发布时间: 2021-08-11 03:13

  京东商品评价组成部分五、优采云人工流程采集目标

  1、使用优采云软件抓取商品评论并将采集的信息保存为Excel文档

  ☆这是本文的主要内容

  2、根据优采云采集发送的评价图片链接URL批量下载评价图片

  ☆优采云不能直接抓取图片,只能抓取图片链接地址。如需批量下载图片,请参见“如何通过链接地址批量下载图片”

  3、通过微词云生成词云,了解消费体验关键点

  ☆这部分内容会出现在其他文章

  四、establish采集target

  第一步:在京东上选择需要抓取的商品进行评估。比如我选择了我喜欢的U型电动牙刷。

  

  选择京东某商品

  第二步:查看京东商品测评的组成部分,明确各个部分的属性。如下图,用户名、用户等级、评价内容、产品属性、评价时间等信息以文字形式呈现,可直接使用采集器采集;而头像、视频、图片等以图片的形式呈现是可以的,采集器只能采集去对应的链接(URL),需要使用其他软件批量下载图片。

  

  JD评估组件

  五、优采云Manual process采集(自动识别)

  第一步:查询并复制商品链接

  

  第 2 步:打开优采云 并创建一个新的自定义任务。

  

  第三步:输入需要采集评论的商品链接,点击“保存设置”。

  

  第四步:上一步结束后,会弹出一个新窗口,窗口会加载你刚刚输入的网址,并开始自动识别网站。

  

  第五步:软件自动识别后,会在窗口底部显示采集字段和字段数据,判断是否是你想要的采集数据。 ①如果这不是你想要的采集数据,点击右侧框中的“切换识别结果”,会切换其他采集结果; ②如果要添加其他字段,点击下方的“+”,然后点击“从页面添加字段”,可以按照说明添加字段,也可以删除不需要的字段; ③如果这是你想要的数据,点击“生成采集Settings”。

  

  第六步:生成采集设置后,会自动生成采集流程图,如图左侧所示。最后,点击右侧框中的“保存并启动采集”。

  

  第七步:选择运行方式,这里选择“启动本地采集”,另外两个需要付费。完成这一步后采集器会开始采集信息。

  

  第8步:下图显示了采集框。当采集达到你想要的评论数量时,你可以点击停止采集并选择“导出数据”。注意:采集这里的效率比较低,因为采集器需要一个采集图片的链接,也就是说采集器需要完全加载图片。

  ☆注意:如果不需要图片链接,可以在第五步切换识别结果,可以节省大量采集时间。

  

  第九步:选择导出文件格式,一般是Excel格式,然后采集就结束了!

  

  

  六、查看Excel文件

  从下图可以看出,这个自动识别过程可以采集评论内容、用户名、头像、所有评测照片的链接、产品属性、评测时间等

  

  以上是整个京东评论的采集流程。如果想进一步下载评论图片,如上图结果预览,可以点击链接①查看;如果要生成词云,了解用户对产品的关注度重要的是,这个可以点击链接②查看。

  链接①:如何通过链接地址批量下载图片

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线