输入关键字 抓取所有网页(360搜索引擎搜索出的结果存在大量虚假诈骗、钓鱼等信息 )

优采云 发布时间: 2021-12-08 14:26

  输入关键字 抓取所有网页(360搜索引擎搜索出的结果存在大量虚假诈骗、钓鱼等信息

)

  昨天,360搜索再次掀起波澜。有网友爆料,360搜索引擎搜索结果中含有大量虚假诈骗、钓鱼等信息。网上有意见认为360搜索引擎并没有最初宣传的那么安全。那么360搜索引擎的安全性如何呢?与传统的百度、谷歌相比,360搜索引擎会不会更有优势?

  要回答这个问题,我们需要从搜索引擎的技术原理说起。搜索引擎的技术实现其实是非常复杂的,尤其是想要取得好的效果,需要耗费大量的人力物力,但是搜索引擎的技术原理其实并不复杂。简单来说就是三步:爬行——Index-sort。

  搜索引擎在工作时,首先会使用一个名为“蜘蛛”或“爬虫”(也称机器人)的爬虫程序访问互联网来访问网站,以及互联网上的所有网址网站爬回来,然后分析索引系统会对爬虫检索到的内容进行分析、计算、构建索引库。当用户在搜索框中输入关键词搜索时,搜索程序从网页索引库中查找所有匹配的相关网页,并根据网页的相关性将结果返回给用户。

  这就是搜索引擎工作的全过程,无论是百度还是谷歌、360,都是在这三个基本原则下工作的。但是,由于目前的爬虫能力、索引能力、排序策略的不同,各个搜索引擎对用户使用的最终结果呈现出了差异化的表现。当前的搜索引擎处于将信息转化为知识的初级阶段。比如你要搜索CCTV,看到CCTV首页出现在第一个搜索结果中,你一定很高兴。但事实是,搜索引擎不明白您要查找的实际上是“中央电视台”。它只匹配关键字中的“CCTV”。

  虽然360在宣传自己的搜索引擎的时候说是安全的搜索引擎,但要真正把搜索引擎的结果提炼成真正意义上的安全内容,却不是一件简单的事情。首先,360应该有一个足够完善的URL网站安全自动检测系统,可以检测其爬虫检索到的内容,然后对内容进行分析,并对可疑的恶意网页进行标记。或者另一种方法是在网民搜索时对网民看到的搜索结果进行安全检查,然后在搜索结果出现时标记所有恶意网页结果。

  从这个过程可以看出,搜索引擎使用的分词、倒排索引、pagerank等都是方法,并不是为了达到安全目的。真正想让用户看到的结果是安全的,必须有一个强大的、完整的URL恶意网站库,并且这个库可以不断更新。

  从这次360爆出的搜索结果中大量恶意欺诈网址来看,很明显360这部分工作积累得还不够,所以现在360宣传自己是一个安全的搜索引擎,也就是有点吹牛。估计周鸿祎也是利用了360品牌在网友心目中的安全定位,为了商业利益,直接将自己的搜索引擎等同于安全。他大概是希望自己能迅速从百度拉拢大量用户,迅速帮助他们。360产生广告收入,这可能是360搜索的核心目的。至于用户使用是否真的安全,周鸿祎的性格可能不会太在意这个。

  有趣的是,360搜索破获大量恶意网址后,第一个拦截恶意网址的人是腾讯电脑管家。目前,百度也在与腾讯电脑管家合作开展安全搜索。使用的方法是百度检索腾讯电脑管家的URL云安全数据库,然后将网页的结果与电脑管家云数据库的数据进行比较,但百度选择了腾讯电脑管家。联合合作成功的机会可能更大。毕竟,就目前业内公认的恶意网址库而言,腾讯是业内最好的。

  最新消息是,9月17日,360对其搜索结果网址进行了紧急加密,主要是为了防止其他安全软件检查其搜索结果中的网址。这与行业中更常见的做法背道而驰。Google 的搜索结果更加开放,允许各种安全供应商检查他们的搜索结果。然而,360对搜索结果进行了加密,将所有竞争对手拒之门外,将用户置于危险之中……

  <IMG style="DISPLAY: block; MARGIN-LEFT: auto; MARGIN-RIGHT: auto" alt="" src="http://www.cww.net.cn/upLoadFile/2012/9/20/201292091727734.jpg" width=500 height=198>

  诺顿提醒谷歌搜索结果安全

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线