优采云关键词URL采集器v2.0.2.0绿色版
优采云 发布时间: 2020-08-06 02:07优采云关键词URL采集器可以根据关键词搜索百度,360,搜狗,谷歌等,并采集搜索结果的URL和标题输出并保存.
优采云关键字URL采集器的主要目的: 分析竞争对手,找出长尾单词;研究平台;采集外部链接;采集示例等. 关键字可以附带受搜索引擎限制的语法. 例如,必须在百度的搜索结果URL中收录bbs关键字,然后输入“关键字inurl: bbs”.
基本介绍
输入关键字采集每个搜索引擎的URL,域名,标题,描述和其他信息,支持百度,搜狗,谷歌,必应,雅虎,360等. 每个关键字有600至800个,采集示例,关键字可以带有搜索引擎参数,就像在网页中输入关键字搜索一样,例如百度的搜索结果URL必须收录bbs关键字,然后输入“关键字inurl: bbs”.
参考数据
#URL#: 采集的原创URL
#Title#: URL对应的网页标题
#domain#: 原创URL的域名部分,例如“”中的“”
#顶级域名#: 采用原创URL的顶级域名部分,例如“”中的“”
#Description#: 页面标题下方的一段描述文字
常见问题
1. 为什么一段时间后无法采集?
这可能是由于搜索引擎限制了太多的采集,请重新启动软件以继续采集,如果不进行更改,则只能等待搜索引擎取消阻止它,然后才能继续采集. 百度的屏蔽时间通常为半小时到几个小时.
但是,即使验证码被阻止,该软件也会弹出手动输入的验证码(百度,Google)
2. 为什么在不同批次的关键字的结果中某些URL重复?
尤其是仅引用#domain#或#top-level domain#之后,这种部分URL重复更为常见. 这也是正常现象,因为每个网站的内页可能收录许多主题,并且可能从网站的不同内页采集了不同的关键字. 引用域名时,同一网站不同内页的域名结果自然是相同的.
此*敏*感*词*内. 如果两个集合的结果中有一些重复的URL,则可以将它们合并在一起,然后使用该软件删除重复的URL(优采云·Text Deduplication Scrambler).
3. 为什么采集的URL的主题与关键字不匹配?
因为在引用#domain#或#top-level domain#后,将采用域名部分. 域名打开了网站的主页,采集的原创URL可能不是主页,而是网站的文章. 内部页面的内部页面收录关键字主题,因此收录在搜索引擎,软件中可以采集它. 但是,在获取域名后,您打开的域名的首页可能不收录关键字.
为了比较集合是否正确,您可以输入保存模板: #title#,将其另存为htm文件,集合之后,您可以打开文件查看比较.
升级日志
1. 转型以支持OEM代理商
2. 添加Bing和Yahoo集合;多次更改
3. 在某些情况下,将Bing,Yahoo,Google更改为https请求以避免采集失败.
4. 增加百度新闻集.
5. 一些更新.
6. 增加关键字分隔线选项.
7. 解决无法采集百度最新更改的问题.
8. 解决了无效采集Bing更改的问题;修复了某些计算机无法使用xmlhttps(涉及Google,Bing,Yahoo)的问题.