关键词采集工具( 使用优采云采集词库换行网内长尾关键词的方法。。)
优采云 发布时间: 2021-11-06 02:01使用优采云采集词库换行网内长尾关键词的方法。。)
词库网关键词 挖掘工具
本文介绍在词库网络中使用优采云采集Long Tail关键词的方法。长尾关键词挖矿对于站长来说是一项非常重要的技能。尾巴在长尾理论中的作用不容忽视。在搜索引擎营销中使用长尾理论来制定关键词策略是非常有效的。
虽然核心关键词或者比较火的关键词会带来一半以上的总流量,但是那些搜索者虽然不多,但是比较清楚关键词(长尾关键词) 合成也可以给网站带来大量的访问量,但正是这些长尾的关键词带来了更高的客户转化率。
采集网站:
/
本文以一组(100个B2B行业索引关键词)为例,对采集这组关键词关键词的所有相关长尾进行介绍。
采集的内容包括:搜索后的长尾关键词、360指数、长尾关键词的搜索量和搜索量
网站(页面)的四个有效字段是请求的第一位。
使用功能点:
●循环文本输入
/tutorialdetail-1/wbxh_7.html
●Xpath
Xpath入门教程1
开始使用 xpath 2
相关XPATH教程-7.0 版本
●数字翻页
/tutorialdetail-1/szfy_7.html
第一步:创建词库网络采集任务
1)进入主界面,选择“自定义采集”
2)将采集的网址复制粘贴到网站的输入框中,点击“保存网址”
第 2 步:创建一个循环以输入文本
1)打开网页后,点击右上角的进程,然后从左边拖一个循环进入
2) 点击循环步骤,在其高级选项中选择文本列表,然后点击下方的A,粘贴所有复制的关键词,注意换行,然后点击确定保存。
3) 创建循环文本输入后,点击页面搜索框,创建输入文本的步骤。
注意,
您无需输入任何文本。如果自动生成的在循环外,则将其拖入,然后检查循环。
4) 右击选择页面上的搜索按钮,设置点击元素。这样循环文本输入就设置好了,搜索到的长尾关键词就在流程的最底层。
第 3 步:创建数字翻页
1)由于搜索结果页面没有下一页按钮,只有数字页面,所以我们需要借助一些xpath的相关知识来设置专门的数字翻页。先到火狐浏览器打开网页,搜索对应的关键词,然后打开
萤火虫工具-小瓢虫
2) 翻到页面底部,找到号码位置的源码。您可以看到当前页面上的数字与其他数字不同。源码中节点的属性类不同。
3) 收入 我们先定位页数
字位置,手写xpath://div[@id="page"]/a[contains(@class,'current')]
4)固定函数的复用
继兄弟
定位节点后的第一个同类节点,注意函数后面的::是固定格式,a[1]指的是节点后的第一个同类节点
5)翻页后可以查看下一页的数字,说明xpath没有问题
6)回到优采云,在左边的进程页面拖一个循环,在高级选项中选择单个元素,把xpath放进去,点击确定保存
7) 然后从左边拖一个click元素进来,在高级选项里勾选循环,就会创建特殊的数字翻页循环
步
4:创建循环列表
1) 我们安装了一个常规的方法来创建一个循环列表,发现在搜索结果之后表格中出现了这一整行无用信息。
2)所以在优采云中无法正常创建循环列表,因为这个无用信息导致优采云自动生成的列表定位不准确
3)所以还是要借助xpath的知识,去Firefox手动创建xpath的循环列表。首先在第一行第一列定位源码位置
4) 然后找到每一行的源码位置,发现都是同一个tbody父节点下的tr标签
5) 然后观察真实的tr节点的每一行都有一个共同的属性“id”,而id属性有一个共同的tr值,所以我们以此为共同点,手写xpath:./ /tbody/tr[contains(@id,'tr')]
, 定位所有的tr节点,过滤掉所有无用的tr,从而创建循环列表的xpath
6) 从左边拖一个循环进入,在循环模式中选择非固定元素,设置
将xpath放入优采云,以第一个循环为例,设置对应的采集字段(因为有些字段不在源码中,所以找不到采集) ,
第五步:启动采集
1) 点击保存任务后,运行采集,以本地采集为例
2)采集 完成后会弹出提示,选择“导出数据”。选择“合适的导出方式”导出采集好的数据。