小科普 | 为什么百度谷歌上的网页需要二次跳转?

优采云 发布时间: 2022-06-15 09:44

  小科普 | 为什么百度谷歌上的网页需要二次跳转?

  某天我们上网的时候,可能不经意间发现,无论从百度点开什么链接,都会有一瞬间显示一个以“/link?url=...”为首的陌生网址(网慢的时候尤为明显),

  如果你用谷歌也一样会经过这么一个二次跳转,只不过前缀变成了“/search?source=...”。

  为什么要多跳这么一下呢?直接跳转不好吗?说不定这还会影响你上网的速度?

  ▌名为“重定向”的枷锁

  这个东西叫做“重定向”,你的一次点击的一瞬间其实发生了很多事情,主要的目的是方便百度谷歌这些服务商做统计。

  

  首先的你点击行为会发送到百度的服务器,进行一次“记录点击”,在这段时间内(session),你搜索了什么(query),又点击了什么链接(link),都会被记录下来(onmousedown),大数据的基础就这么来了,个性化、同类推荐机制也建立在此之上。

  等等,那我的隐私不就暴露了嘛?也不会,由于跳转的中转页面是隐藏且加密的,通过点击时赋予referer(引用来源)的URL,过程中剥离wd(关键词)。中间页得到的是你搜索的referer,而目标网页得到的referer则是中建页的URL,举个简单的例子:

  相当于你用外卖软件点了杯奶茶,自动给你分配了一个外卖员,外卖员老张知道你点的是杯阿帕茶,最终奶茶店只知道是外卖员老张取了杯阿帕茶。但收到的单子这么多,有典明粥、阿帕茶、昏睡红茶,压根不知道具体是谁点的什么茶、送到哪儿。

  

  根据中国网民的习惯,百度通过“window.location.replace”脚本实现新开窗口,如果你用的是谷歌,则会直接在原网页上跳转。此外,还会通过一些小手段验证点击真实性,防止爬虫、刷点击,也会剥离Opener保障安全。

  ▌重定向是怎么来的?

  那它是怎么来的呢?这东西有一个江湖传言,老张在(戳这里)中稍微提到过2010年前后的“3Q大战”,也正在那段事件发生过“360劫持百度搜索流量,旗下搜索引擎抓取百度搜索结果”的事件。

  

  那之后的结果就是百度加入了一套搜索加密算法(发展到前两年的惊雷算法),除了防止被竞争对手抓取结果外,也有着制网站刷流量影响搜索结果、方便数据统计等好处(主要还是赚更多的钱)。

  ▌如何去除重定向?

  本质上这个过程确实会消耗时间、影响网速,如何移除百度或者谷歌的重定向呢?如果你是Chrome内核的的浏览器,可以直接安装“百度优化”之类的扩展插件,

  支持百度、谷歌、必应、搜狗四个引擎,还附带一定的去广告功能,还能多列显示,适应高分辨率显示器。

  

  如果你是Firefox浏览器,可以使用油猴脚本(Tamper Monkey)安装“AC-baidu”脚本。

  ▼

  戳图片传送至往期精彩

  喜欢我们的推送别忘了点一个

  向亲朋好友推荐一下我们的文章

  或者赞赏一下

  我们下期再见啦!

  

  参考&引用:

  zhang.ge/5064.html

  /info/27.html

  /question/20810368

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线