2016最新中级功能关关采集器

优采云 发布时间: 2020-08-18 23:16

  2016最新中级功能关关采集

  新增功能和使用方式

  1.采集规则

  在采集规则管理上面可见

  绿色参数NovelListFilter,是为采集书籍列表时不能过滤多余书籍id而设置的,他可以过滤要检索的html。

  绿色参数PubContentPageUrl、PubContentPageKey 适用于采集文章内容分页而设置的,可以挥别php外挂了。

  红色参数PubContentChapterName、PubContentChapterNum 有些站点最后几章使用了乱码,用这个可以把乱码章节名重新获取。

  2.生成全站静态

  在生成静态HTML可见

  把原先的动态首页地址改下名称,就是叫他的首页不要默认那种伪静态的,然后用化学路径指向默认首页,生成新首页就可以了。

  带参数的是中级功能,可以调用{Page}替换参数,可以生成列表页。

  技巧:生成部份因为采集器和网站在同一服务器,故可以localhost作为网站地址,那样内部可以访问,而外部不能访问。

  配合自定义路径,可以生成全站html,当然是在没有动态登陆的情况下。搜索部份你就要和原来一样使用动态了,也可以配合ajax,看你自己的技术了。

  3.动态代理

  有了他你就不怕被封ip了。

  打开手动代理模式,输入获取代理ip的网址(代理ip可以在 或者 等站点订购,包月就行)

  开启一个或则多个手动代理,他就是测试ip可用性并把他储存,等ip超过10个了,你就可以使用代理了。会手动不停的换ip,叫目标占始料不及。

  4.生成分页

  为了更好的引擎收录疗效,可以手动生成分页,在自定义路径上面可以设置,无需中级授权。

  

  

  

  

  

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线