关键词网址采集器
优采云 发布时间: 2020-08-04 06:01关键词网址采集器是一款可以帮助用户同学批量采集指定关键词网址的利器,如果您认为您在搜集指定关键词网址中遇见了许多麻烦,不放使用这款完全免费的关键词网址采集器,输入指定的关键词即可一键采集。。
相关软件软件大小版本说明下载地址
关键词网址采集器是一款可以帮助用户同学批量采集指定关键词网址的利器,如果您认为您在搜集指定关键词网址中遇见了许多麻烦,不放使用这款完全免费的关键词网址采集器,输入指定的关键词即可一键采集。
基本简介
输入关键字采集各搜索引擎的网址、域名、标题、描述等信息,支持百度、搜狗、谷歌、必应、雅虎、360等。每个关键词600到800条,采集例子,关键词可以附送搜索引擎参数,就跟网页里输入关键词搜索一样,如百度里搜索结果网址中必须包含bbs的关键词,则输入“关键词 inurl:bbs.”
引用数据
#网址#:采集的原始网址
#标题#:网址对应的网页标题
#域名#:原始网址的域名部份,如“”中的“”
#顶级域名#:取原始网址的顶级域名部份,如“”中的“”
#描述#:网页标题下边的一段描述文字
常见问题
1.为什么采集一段时间以后,无法采集?
这可能采集多了被搜索引擎限制关键词采集器,重启软件可继续采集,如果不换,只能等待搜索引擎取消屏蔽以后能够继续采集。百度的屏蔽时间一般半小时到数小时。
不过,现在虽然出现验证码屏蔽,软件也会弹出验证码自动输入的(百度、谷歌)
2.不同批次关键词采集的结果为何会存在部份网址重复?
尤其是只引用了 #域名# 或 #顶级域名# 之后,这种部份网址重复的情况比较多。这也是正常的,因为每位网站的内页可能包含好多主题,不同关键词都可能采集到该网站的不同内页,当引用域名后,相同网站的不同内页的域名结果自然就相同了。
另*敏*感*词*的。如果两次采集的结果存在部份网址重复,可以把她们合并一起,使用软件去重(优采云·文本去重打乱器)。
3.为什么采集回来的网址的主题与关键词不符?
是因为引用了 #域名# 或 #顶级域名# 后关键词采集器,取的是域名部份,域名打开的是该网站的首页,而采集的原网址可能不是首页,而是该网站的某一篇文章的内页,该内页包含关键词主题,因此被搜索引擎收录,软件能够采集得到。但取域名后,你打开的域名首页就不一定包含该关键词。
为了比对采集是否正确,可以在保存模板里输入:,保存为htm文件,采集完后可以自己打开该文件查看比对。
更新日志
1.改造为支持OEM代理
2.增加必应和雅虎采集;多项改动
3.将必应、雅虎、谷歌改为https恳求以防止一些情况下的采集失败问题。
4.增加百度新闻采集。
5.一些更新。
6.增加关键词分割线选项。
7.修复百度最新变动未能采集的问题。
8.修补必应改动采集失效问题;修复个别笔记本不能使用xmlhttps的问题(涉及微软、必应、雅虎)。