搜索引擎优化书籍(用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到)
优采云 发布时间: 2022-02-21 20:17搜索引擎优化书籍(用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到)
单击此处下载,更多最新版本,网络营销视频,书籍,档案,文章.....
3、在索引库中搜索排序
当用户输入 关键词 搜索时,搜索系统程序将从网页索引数据库中查找与 关键词 匹配的所有项目。
有相关页面。因为这个关键词的所有相关网页的相关度都已经计算过了,只需要按照已有的相关度
度值是排序的,相关性越高,排名越高。最后由页面生成系统生成搜索结果的链接地址和页面。
人脸内容摘要等内容被整理并返回给用户。
三、搜索结果
搜索引擎蜘蛛一般会定期重访所有网页(每个搜索引擎的周期不同,可能是几天,
周或月,对于不同重要性的网页也可能有不同的更新频率),更新网页索引数据库以反映
反映网页文字更新状态,新增网页信息,去除死链接,分析
更改被重新排序。这样,网页的具体文字变化就会反映在用户的查询结果中。
虽然只有一个互联网,但每个搜索引擎的能力和偏好都不一样,所以爬取的网页不一样,排名也不一样。
顺序算法也不同。大型搜索引擎的数据库存储了数千万到数十亿在互联网上被索引的网页。
数据量达到数千甚至数万千兆字节。但即使是最大的搜索引擎也会建立超过 20 亿个网页的索引数据库。
它占互联网普通网页的比例不到30%,不同搜索引擎之间网页数据的重叠率一般在70%以下。
人们使用不同的搜索引擎的重要原因是因为他们可以分别搜索不同的网页。网上有
大量的网页不能被搜索引擎抓取和索引,也不能被搜索引擎搜索到。
使用超链接分析的搜索引擎未能收录的网页包括:网页的性质和Spider无法正确处理的文档类型
类型(如Flash、脚本、JS、一些动态网页和框架、数据库);没有主动登录搜索引擎,也没有
带有链接的岛屿页面;当蜘蛛出于某种原因访问它时恰好是死链接的页面;被认为是一个质量差的网站
未被抓取的页面;因*敏*感*词*、反动、垃圾等问题而未被抓取的非法网页;需要输入用户名和密码才能访问
打开网页;网站 使用 robots 协议被搜索引擎拒绝的网页;搜索引擎还没有来得及抓取的新网页
页数;具有非 http 信息的网页,例如 go-pher、新闻组、np、wais 等。
任何带有“?”的网页 地址中的“&”符号(和其他类似符号)将被“蜘蛛”程序阻止。
这些网页通常由CGL、PHP、ASP等程序生成,技术先进,但不适合搜索引擎的“蜘蛛”。
“蜘蛛”计划。虽然一些大型搜索引擎(如谷歌)具有检索动态网页的能力,但
有些引擎仍然不支持它。甚至能够索引动态网页的谷歌也曾多次展示
它不保证将检索所有动态网页。
四、超链接分析技术的应用
超链接分析技术已被世界各大搜索引擎广泛采用。在我国使用该技术的搜索引擎包括:
百度(引擎使用高性能“网络蜘蛛”程序自动
可定制且高度可扩展的调度算法使搜索者能够采集最大数量的
互联网信息。百度在中文互联网中具有天然优势,支持搜索1.3亿中文网页,是目前最大的
中文搜索引擎。而且,百度每天都在增加几十万个新网页,重要的中文网页每天都在更新。百
除了使用超链接分析排名,它还进行PPC排名。具有网页快照、相关搜索、中文名称识别、简繁体
具有文本自动转中文、网页预览等功能,还可以进行专业的MP3搜索、Flash搜索、新闻搜索等。