Sm·关键字URL采集器V2.12

优采云 发布时间: 2020-08-06 06:11

  根据关键字搜索百度,搜狗,谷歌,必应,雅虎,360等,并采集并保存搜索结果的URL和标题. Google需要克服困难. 每个关键字600到800. 采集示例>>

  关键字可以附带搜索引擎参数,就像在网页上输入关键字搜索一样. 例如,如果bbs关键字必须收录在百度的搜索结果URL中,请输入“关键字inurl: bbs”.

  保存模板可以引用的数据:

  #URL#: 采集的原创URL

  #Title#: URL对应的网页标题

  #domain#: 原创URL的域名部分,例如“”中的“”

  #顶级域名#: 采用原创URL的顶级域名部分,例如“”中的“”

  #Description#: 页面标题下方的一段描述文字

  问题要点:

  1. 为什么一段时间后无法采集?

  这可能受到搜索引擎的限制. 通常,您可以通过更改IP(例如使用VPN更改IP)来继续采集. 如果您没有更改,则只能等待搜索引擎取消阻止,然后再继续采集. 百度的屏蔽时间通常为半小时到几个小时.

  2. 为什么在不同批次的关键字采集结果中某些URL重复?

  尤其是仅引用#domain#或#top-level domain#之后,这种部分URL重复更为常见. 这也是正常现象,因为每个网站的内页可能收录许多主题,并且可能从网站的不同内页采集了不同的关键字. 引用域名时,同一网站不同内页的域名结果自然是相同的.

  此*敏*感*词*内. 如果两个集合的结果中有重复的URL,则可以将它们合并在一起,并使用该软件删除重复项(重复数据删除加扰器).

  3. 为什么采集的URL的主题与关键字不匹配?

  这是因为在引用#domain#或#top-level domain#之后,将使用域名. 域名打开了网站的主页,采集的原创URL可能不是主页,而是网站的文章. 文章的内页,内页收录关键字主题,因此它收录在搜索引擎中,软件即可采集它. 但是,在获取域名后,您打开的域名的首页可能不收录关键字.

  为了比较采集是否正确,可以输入保存模板:

  ,将其另存为htm文件,您可以打开文件以查看采集后的比较结果.

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线