如何使用优采云采集词库网内长尾关键词的方法

优采云 发布时间: 2021-07-05 02:25

  如何使用优采云采集词库网内长尾关键词的方法

  本文介绍优采云采集词库网内长尾关键词的使用方法。长尾关键词挖矿对于站长来说是一项非常重要的技能。尾巴在长尾理论中的作用不容忽视。使用长尾理论来制定搜索引擎营销中的关键词策略非常有效。

  虽然核心关键词或者比较火爆的关键词会带来总流量的一半以上,但是那些搜索者并不多,但是越清晰的关键词(长尾关键词)也全面了吧可以为网站带来大量的访问量,但正是这些长尾关键词带来了更高的客户转化率。

  采集网站:

  本文以一组(100个关键词在B2B行业有索引)为例,来采集关于这组关键词所有相关的长尾关键词。

  采集的内容包括:搜索后的长尾关键词、360指数、长尾关键词搜索量和搜索量第一个数网站(页面)这四个有效字段。

  使用功能点:

  lCycle 文本输入

  /tutorialdetail-1/wbxh_7.html

  lXpath

  l数字翻页

  第一步:创建词库 network采集task

  1)进入主界面,选择“自定义采集”

  

  2) 将采集的网址复制粘贴到网站输入框中,点击“保存网址”

  

  第 2 步:创建一个循环以输入文本

  1)打开网页后,点击右上角的进程,然后从左边拖一个循环进来

  

  2)点击循环步骤,在其高级选项中选择文本列表,然后点击下方的A,将所有复制的关键词粘贴进去,注意换行,然后点击确定即可保存。

  

  3) 创建循环文本输入后,点击页面搜索框,创建输入文本的步骤。请注意,您不需要输入任何文本。如果自动生成的在循环外,则将其拖入,然后检查循环即可。

  

  

  4) 右击选择页面上的搜索按钮,设置点击元素。这样循环文本输入就设置好了,搜索到的长尾关键词就在流程的底部了。

  

  第 3 步:创建数字翻页

  1) 由于搜索结果页没有下一页按钮,只有数字页,所以我们需要借助一些xpath的相关知识来设置专门的数字翻页。先到火狐浏览器打开网页搜索对应的关键词,然后打开浏览器右上角的firebug工具-小瓢虫(不懂的同学可以去官网教程看对应的xpath教程)

  

  2)翻到页面底部,找到号码位置的源码。您可以看到当前页面上的数字与其他数字不同。源码中节点的属性类不同

  

  3)basis 我们先定位页面的数字位置,手写xpath://div[@id="page"]/a[contains(@class,'current')]

  

  4) 然后使用固定函数follow-sibling定位到节点之后的第一个同类节点。注意函数后面的::是固定格式,a[1]指的是节点后的第一个节点。相似节点

  

  5)翻页后可以查看下一页的数字,说明xpath没有问题

  

  6)返回优采云,在左侧流程页面拖一个循环,在高级选项中选择单个元素,将xpath放入其中,点击确定保存

  7)然后从左边拖一个click元素进来,在高级选项中勾选循环,就会创建特殊的数字翻页循环

  

  第 4 步:创建循环列表

  1)我们安装了常规的方法创建循环列表,发现搜索结果后表格中出现了这一整行无用信息。

  

  2)所以无法在优采云中正常创建循环列表,因为这个无用信息导致优采云自动生成的列表不准确

  

  3) 所以还是要借助xpath的知识,去Firefox手动创建xpath的循环列表。先在第一行第一列定位源码位置

  

  4)再次查找每一行的源码位置,发现在tbody的父节点下都是同一个tr标签

  

  5) 然后观察真正的tr节点的每一行都有一个共同的属性“id”,而id属性有一个共同的tr值,所以我们以此为共同点,手写xpath:。 //tbody/tr[contains(@id,'tr')],定位所有tr节点,过滤掉所有无用的tr,从而创建循环列表的xpath

  

  6)从左侧拖出一个循环,在循环模式下选择unfixed元素,将xpath放在优采云中,以第一个循环为例,设置对应的采集字段(由于有些字段在源码中是没有的,所以采集not)

  

  

  第五步:开始采集

  1)点击保存任务,运行采集,以本地采集为例

  

  2)采集 完成后会弹出提示,选择“导出数据”。选择“合适的导出方式”导出采集good数据。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线