seo搜索引擎优化论文(可分为三种搜索引擎分类按其工作方式主要三种)
优采云 发布时间: 2021-10-25 20:11seo搜索引擎优化论文(可分为三种搜索引擎分类按其工作方式主要三种)
可以分为三种类型的搜索引擎。分类搜索引擎根据其工作方式可分为三类。它们是全文搜索引擎、搜索索引/目录和元搜索引擎。搜索引擎)。全文搜索引擎 全文搜索引擎是名副其实的搜索引擎。国外的代表有谷歌、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度。它们都是根据从互联网上提取的每个网站的信息(主要是网页文本),检索出符合用户查询条件的相关记录,然后将结果返回给用户,所以它们是真正的搜索引擎。从搜索结果的来源来看,全文搜索引擎可以细分为两种,一种是有自己的搜索程序(Indexer),俗称“蜘蛛”程序或“机器人”程序,以及自建网页数据库,搜索结果直接从自己的数据库中调用,比如上面提到的7个引擎; 另一种是租用其他引擎的数据库,按照自定义格式排列搜索结果,比如Lycos引擎。目录索引 虽然目录索引具有搜索功能,但严格意义上它并不是真正的搜索引擎。它只是按目录分类的 网站 链接列表。并以自定义格式排列搜索结果,例如 Lycos 引擎。目录索引 虽然目录索引具有搜索功能,但严格意义上它并不是真正的搜索引擎。它只是按目录分类的 网站 链接列表。并以自定义格式排列搜索结果,例如 Lycos 引擎。目录索引 虽然目录索引具有搜索功能,但严格意义上它并不是真正的搜索引擎。它只是按目录分类的 网站 链接列表。
用户无需搜索关键词(Keywords),仅依靠分类目录就可以找到自己需要的信息。最具代表性的目录索引是大名鼎鼎的雅虎。其他著名的还有开放目录计划(DMOZ)、LookSmart、About等,国内搜狐、新浪、网易搜索也属于这一类。元搜索引擎(META Search Engine) 当元搜索引擎接受用户的查询请求时,它会同时在多个其他引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎包括InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表)。在中文元搜索引擎中,有一个搜索引擎叫星星。在搜索结果排列方面,有的直接按照来源引擎对搜索结果进行排列,比如Dogpile,还有一些按照自己的规则重新排列组合结果,比如Vivisimo。除上述三类引擎外,还有以下几种非主流形式: 集成搜索引擎:如HotBot于2002年底推出的引擎。该引擎与META搜索引擎类似,不同之处在于用户从提供的四个引擎中进行选择,而不是同时调用多个引擎进行搜索,因此将其称为“集体”搜索引擎更为准确。门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但没有目录或网络数据库,搜索结果完全来自其他引擎。除上述三类引擎外,还有以下几种非主流形式: 集成搜索引擎:如HotBot于2002年底推出的引擎。该引擎与META搜索引擎类似,不同之处在于用户从提供的四个引擎中进行选择,而不是同时调用多个引擎进行搜索,因此将其称为“集体”搜索引擎更为准确。门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但没有目录或网络数据库,搜索结果完全来自其他引擎。除上述三类引擎外,还有以下几种非主流形式: 集成搜索引擎:如HotBot于2002年底推出的引擎。该引擎与META搜索引擎类似,不同之处在于用户从提供的四个引擎中进行选择,而不是同时调用多个引擎进行搜索,因此将其称为“集体”搜索引擎更为准确。门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但没有目录或网络数据库,搜索结果完全来自其他引擎。但不同的是,用户不是同时调用多个引擎进行搜索,而是从提供的四个引擎中进行选择,所以称其为“集体”搜索引擎更为准确。门户搜索引擎:AOL Search、MSN Search等虽然提供搜索服务,但没有目录或网络数据库,搜索结果完全来自其他引擎。但不同的是,用户不是同时调用多个引擎进行搜索,而是从提供的四个引擎中进行选择,所以称其为“集体”搜索引擎更为准确。门户搜索引擎:虽然AOL Search、MSN Search等提供搜索服务,但它们没有目录或网络数据库,其搜索结果完全来自其他引擎。
Free For All Links (FFA):这类网站一般只是简单的滚动排列链接条目,少数有简单的分类,但规模远小于雅虎等目录索引。由于上述网站都为用户提供搜索查询服务,为了方便起见,我们通常将它们统称为搜索引擎。搜索引擎的基本工作原理了解搜索引擎的工作原理,对我们日常的搜索应用和网站的投稿和推广都有很大的帮助。全文搜索引擎在搜索引擎分类部分,我们提到了全文搜索引擎从网站中提取信息来构建网页数据库的概念。搜索引擎的自动信息采集功能有两种类型。一种是定时搜索,即每隔一定时间(比如谷歌一般需要28天),搜索引擎会主动发出“蜘蛛”程序在一定IP地址范围内搜索互联网网站,一旦发现新的网站,它会自动提取网站的信息和URL并将其添加到其数据库中。另一种是提交对网站的搜索,即网站的拥有者主动向搜索引擎提交网址,在一定时间内将其定向到你的网站时间(从2天到几个月不等) 发出“蜘蛛”程序,扫描您的网站并将相关信息保存在数据库中,供用户查询。由于近年来搜索引擎索引规则的巨大变化,
当用户搜索带有关键词的信息时,搜索引擎会在数据库中进行搜索。如果找到符合用户要求的网站,就会使用特殊的算法——通常根据网页上的关键词匹配度、出现位置/频率、链接质量等——计算每个网页的相关性和排名级别,然后根据相关性将这些网页链接依次返回给用户。与全文搜索引擎相比,目录索引有很多不同之处。首先,搜索引擎是自动网站搜索,而目录索引则完全是手动的。用户提交网站后,目录编辑会亲自浏览你的网站,然后决定是否接受你的网站 基于一套自行确定的标准,甚至是编辑的主观印象。其次,搜索引擎收录网站时,只要网站不违反相关规则,一般都会登录成功。目录索引对网站的要求要高很多,有时即使多次登录也不一定成功。尤其是像雅虎这样的超级索引,登录更是难上加难。(因为登录雅虎是最难的,也是企业网络营销的必备,后面会专门介绍登录雅虎的技巧)另外,在登录搜索引擎的时候,我们一般不需要考虑。@网站 分类问题,登录目录索引时必须把网站 在最合适的目录(Directory)中。最后,搜索引擎中每个网站的相关信息都是自动从用户的网页中提取出来的,所以从用户的角度来说,我们有更多的自主权;而目录索引要求你必须手动填写额外的网站Information,并且有各种限制。
另*敏*感*词*。默认搜索模式下,部分目录搜索引擎首先返回自己目录下匹配的网站,如搜狐、新浪、网易等;而其他人则默认为网络搜索,例如 Yahoo。搜索引擎第三定律。搜索引擎已经走到今天。是时候结束过去,开启未来了。为了澄清我所说的第三定律,让我们先回顾一下第一定律和第二定律。相对论第一定律听起来像一篇学术论文。的确,连第一和第二定律之前都没有提到,但第一和第二定律的内容确实在工业界和学术界已经获得了很长时间。这是公认的。
事实上,早在互联网出现之前,学术界就已经广泛研究了第一定律,这就是所谓的关联定律。这个领域被称为信息检索,或信息检索,也被称为全文检索。当时,相关性是基于词频统计的。也就是说,当用户输入搜索词时,搜索引擎会寻找那些在文章(网页)中出现频率更高、位置更重要的搜索词。,加上一些对搜索词本身的常用程度的加权,最后排出一个结果(搜索结果页)。早期的搜索引擎结果排序是基于本文第一定律的,比如Infoseek、Excite、Lycos等,基本沿袭了互联网时代之前学术界的研究成果,而这个行业的主要精力是处理大访问量。在海量数据方面,相关性排名没有突破。事实上,词频统计根本不使用任何与网络相关的特征。它是前网络时代的一项技术。但是,互联网时代的主要文档都是网页形式,几乎每个人都可以随意在互联网上发布各种内容。词频相同的两个网页的质量可以相差很大,但是按照搜索引擎排名第一的规律,这两个网页的顺序应该是一样的。为了在某些搜索结果中名列前茅,很多网络内容创作者绞尽脑汁,在自己的页面上堆起了关键词。搜索引擎对此无法防御,这很悲惨。这种情况在 1996 年开始改变。第二定律、流行度和质量定律 1996 年 4 月,我去拉斯维加斯召开了一个关于信息检索的学术会议。会议的内容就像拉斯维加斯的天气一样,平时闷闷不乐。
但远离公司,我难得有机会冷静下来认真思考问题。在听一篇无关紧要的论文介绍时,我突然将科学引文索引的机制与网络上的超链接联系起来——感谢北大,她在我大三的时候教我科学引文索引系统机制,恐怕当你读本科时,美国没有大学会教你这些东西。科学引文索引的机制,说白了就是,论文被引用次数多的论文被认为是权威论文,论文就是好论文。当这个想法移植到互联网上时,链接次数较多的网页被认为是高质量和高人气的网页。添加相应的链接文本分析后,可用于对搜索结果进行排序。这就引出了搜索引擎的第二定律:人气和质量定律。根据这个规律,搜索结果的相关性排名并不完全依赖词频统计,而更多地依赖于超链接分析。我意识到这是一个突破。回去后,我迅速总结思路,于1996年6月申请了这方面的美国专利。1999年7月6日,美国专利商标局批准了专利号5,920,859,我是唯一的发明人。1996年底左右,斯坦福大学计算机系的两名*敏*感*词*也想到了同样的解决方案。他们后来创建了一个名为 Google 的搜索引擎。Google 的 网站 仍然说他们的技术是专利。
不管怎样,超链接分析的方法在1998年后逐渐被各大搜索引擎所接受。由于链接是网络内容的基本特征,此时的搜索引擎开始真正利用互联网时代的检索技术。世界是不可预测的。2000年以来,互联网泡沫迅速破灭。主要搜索引擎要么被收购,要么被推迟上市。所有使用人气和质量定律的搜索引擎公司都未能幸免。那么,搜索引擎的出路在哪里?第三定律,自信定律,人气定律,质量定律,解决一个技术问题。然而,搜索引擎自诞生之日起,就从来就不是一个纯粹的技术现象。它结合了技术、文化、市场等各个层面的因素。. 解决搜索引擎企业的生存和发展问题,需要搜索引擎第三定律——自信定律。1998 年,没有多少人认真对待一家距离硅谷 500 英里刚刚成立并被称为(现在更名为 Overture)的公司。它只是购买了一个搜索引擎的技术服务,然后将他们在 GoTo 搜索结果中的 网站 排名拍卖给那些支付更多的 网站 所有者,谁支付了 网站 在顶部,根据网友点击网站的情况计算付费,只出现在搜索结果中不需要付费。这是自信法则的最早践行者!根据这个规律,搜索结果的相关性排名,
谁对自己的网站有信心,谁就会排第一。自信的表现愿意为这个排名买单。需要说明的是,自信法则也是我给这个模型起的名字,之前的文献中没有人这样概括过。在互联网行业萧条、纳斯达克动荡的今天,GoTo如火如荼,市值13亿美元,营收高达雅虎总营收的35%。回顾门户网站网站,哪一家可以从其搜索引擎服务中获得三分之一的总收入?原因是GoTo首先践行了搜索引擎的自信法则。过去搜索引擎是按CPM收费的,CPM是从传统广告行业借来的。它没有考虑即时性,网络媒体的互动性和易出价特点。但是,对于竞价排名,点击费用是网站店主直接提供销售线索,而不是传统意义上的广告。自信法则改变了过去搜索引擎靠CPM收钱的尴尬局面,开创了真正属于互联网的收费模式。