关键词采集词(使用优采云采集词库换行网内长尾关键词的方法。。 )
优采云 发布时间: 2021-12-10 19:20关键词采集词(使用优采云采集词库换行网内长尾关键词的方法。。
)
本文介绍在词库网络中使用优采云采集Long Tail关键词的方法。长尾关键词挖矿对于站长来说是一项非常重要的技能。尾巴在长尾理论中的作用不容忽视。在搜索引擎营销中使用长尾理论来制定关键词策略是非常有效的。
虽然核心关键词或者比较火的关键词会带来一半以上的总流量,但是那些搜索者虽然不多,但是比较清楚关键词(长尾关键词) 合成也可以给网站带来大量的访问量,但正是这些长尾的关键词带来了更高的客户转化率。采集网站:
本文以一组(100个B2B行业索引关键词)为例,对采集这组关键词关键词的所有相关长尾进行介绍。
采集的内容包括:搜索后长尾关键词、360指数、长尾关键词搜索量和搜索量第一网站(页面)这些四个有效字段。
使用功能点:
l 循环文本输入
/tutorialdetail-1/wbxh_7.html
路径
Xpath入门教程1
开始使用 xpath 2
相关XPATH教程-7.0 版本
l 数字翻页
/tutorialdetail-1/szfy_7.html
第一步:创建词库网络采集任务
1)进入主界面,选择“自定义采集”
2)将采集的网址复制粘贴到网站的输入框中,点击“保存网址”
第 2 步:创建一个循环以输入文本
1) 打开网页后,点击右上角的进程,然后从左边拖一个循环进入
2) 点击循环步骤,在其高级选项中选择文本列表,然后点击下方的A,将所有复制的关键词粘贴进去,注意换行,然后点击确定保存。
3) 创建循环文本输入后,点击页面搜索框,创建输入文本的步骤。请注意,您不需要输入任何文本。如果自动生成的在循环之外,则将其拖入,然后勾选仅选择循环。
4)右击选择页面搜索按钮,设置点击元素。这样循环文本输入就设置好了,搜索到的长尾关键词就在流程的底部。
第 3 步:创建数字翻页
1) 由于搜索结果页没有下一页按钮,只有数字页数,所以我们需要借助一些xpath的相关知识来设置专门的数字翻页。先去火狐浏览器打开网页搜索对应的关键词,然后打开浏览器右上角的firebug工具——小瓢虫(不懂的同学可以去官方网站教程看对应的xpath教程)
2) 翻到页面底部,找到号码位置的源码。您可以看到当前页面上的数字与其他数字不同。源码中节点的属性类不同。
3)为了收益,我们先定位页面的数字位置,手写xpath://div[@id="page"]/a[contains(@class,'current')]
4) 然后使用固定函数follow-sibling定位节点后的第一个同类节点。注意这个函数后面的::是固定格式,a[1]指的是节点之后的第一个节点类似的节点
5)翻页后可以查看下一页的数字是否正常定位,说明xpath没有问题
6)回到优采云,在左边的进程页面拖一个循环,在高级选项中选择单个元素,把xpath放进去,点击确定保存
7) 然后从左边拖一个click元素进来,在高级选项里勾选循环,就会创建特殊的数字翻页循环
第 4 步:创建循环列表
1) 我们安装了一个常规的方法来创建一个循环列表,发现在搜索结果后的表格中出现了这一整行无用的信息。
2)所以在优采云中无法正常创建循环列表,因为这个无用的信息导致优采云的自动生成的列表定位不准确
3)所以还是要借助xpath的知识,去Firefox手动创建xpath的循环列表。首先在第一行第一列定位源码位置
4) 然后找到每一行的源码位置,发现都是同一个tbody父节点下的tr标签
5) 然后观察到真正的tr节点的每一行都有一个共同的属性“id”,而id属性有一个共同的tr值,所以我们以此为共同点,手写xpath:./ /tbody/tr[contains(@id,'tr')],定位所有tr节点,过滤掉所有无用的tr,从而创建循环列表的xpath
6)向左拖一个loop进入,在loop方法中选择unfixed元素,将xpath放在优采云中,以第一个loop为例,设置对应的采集字段(因为源码中有些字段没有,所以找不到采集)
第五步:启动采集
1) 点击保存任务后,运行采集,以本地采集为例
2)采集 完成后会弹出提示,选择“导出数据”。选择“合适的导出方式”导出采集好的数据。