采集器(为什么不用广告收集器把广告也抓起来呢?)

优采云 发布时间: 2021-09-06 13:09

  采集器(为什么不用广告收集器把广告也抓起来呢?)

  采集器只是能采集网页上的信息但你说的大部分网站都是不用js的,所以应该不行,不过给你一个思路你可以自己考虑下:你自己写个脚本来收集每个网页上的http请求,然后你就能分析什么样的抓取器对应什么样的页面,因为有user-agent这种东西在,分析出来后通过oneapm之类的比对就能找到是哪个网站的哪些页面了。

  没用的,网站是不存在页面间快速跳转的。即使是移动端,按浏览器提供的app或浏览器搜索标识,也只能搜索到第一个页面,随着收录的页面越来越多,就会逐渐过滤掉,这就是一个正常的搜索路径,根本不存在访问量排名上的影响。

  pc端因为浏览器特性,页面之间跳转比较少,而手机端的浏览器兼容性问题比较多,你只能用大的分析器去抓页面并展示给其他用户,

  chrome用的是googlesearchschshallgo,然后根据页面标题或者关键词进行相关搜索,返回很多的相关页面。你可以先用这个做参考,其他不懂可以到我的博客看看。

  为什么不用广告收集器把广告也抓起来呢?

  知乎有可以直接跳转多个网站的插件:

  那么多可以移动终端浏览的网站,

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线