关键词采集软件(百度、搜狗、谷歌支持一页100个结果的使用方法)
优采云 发布时间: 2021-09-18 18:11关键词采集软件(百度、搜狗、谷歌支持一页100个结果的使用方法)
优采云关键词website采集器是一个网站信息采集软件。通过输入每个搜索引擎的关键字采集网站、域名、标题、描述等信息,采集速度快、质量高
使用方法
[搜索引擎]百度、搜狗和谷歌支持每页100条结果,选中“每页10条结果”时支持10条结果
[仅限采集指定排名]例如,如果您希望采集No2、3和5,然后输入“2 | 3 | 5”(不包括引号)。如果未启用此选项,则所有采集
[输入@关键词list]一次一行@
如果[采集pages]设置为0,采集所有搜索页面
[每页页数]不同的搜索引擎对每页页数有不同的限制。百度最多50家,谷歌和搜狗100家,其他基本都是10家或20家
如果勾选[Google Bing英语站],则将使用Google Bing的全球英语站进行搜索,否则将使用中文站进行搜索
勾选[Google Bing no waiting]使这三个引擎采集无需等待,即高速采集,否则每采集页面会自动等待一定时间。添加此选项的原因是最近(2015年8月8日)对三台发动机进行了测试。设置搜索间隔似乎没有用。Bing已经测试了十几个没有验证码的@关键词非等待搜索,因此无法处理验证码。谷歌只在开始时多次出现验证码,没有等待大量搜索,也没有验证码出现在最后。然而,谷歌可以自动判断验证码的出现并将其发布给用户
[保存目录]将采集结果保存在此目录中。保存的文件名为搜索引擎@关键词
[重要信息]右键单击已保存目录的选择按钮“.”,以找到该目录
常见问题
1.为什么在一段时间后不能采集呢
这可能是采集更受搜索引擎的限制。通常,您可以通过更改IP继续采集。如果你不改变它,你只能在搜索引擎取消屏蔽后继续采集。百度的屏蔽时间通常是半小时到几个小时
但是,即使验证码被屏蔽,软件也会弹出手动输入的验证码(百度、谷歌)
2.为什么在不同批处理的结果中有一些重复的URL@关键词采集
特别是仅引用“域名”或“顶级域名”后,重复网站更多。这也是正常的,因为每个网站内页可能收录许多主题,而不同的@关键词may采集对应于此网站. 当域名被引用时,同一网站的不同内页的域名结果自然是相同的
此*敏*感*词*内。如果两次采集的结果中有一些重复的URL,可以通过软件将它们合并在一起并删除
3.为什么采集返回的网站主题与关键词不一致@
原因是,在引用“域名”或“顶级域名”后,域名部分被占用。域名打开网站的主页,采集的原创网站可能不是主页,而是网站的文章的内页,其中收录@关键词主题。因此,软件可以通过搜索引擎收录获得采集。但是,获取域名后,您打开的域名主页不一定收录@关键词
要检查采集是否正确,可以输入:#Title#,将其另存为保存模板中的HTM文件。采集完成后,您可以打开该文件以检查比较