seo优化搜索引擎工作原理(一下搜索引擎的工作原理吗?抓取2.过滤3.收录)
优采云 发布时间: 2022-04-20 08:03seo优化搜索引擎工作原理(一下搜索引擎的工作原理吗?抓取2.过滤3.收录)
你知道搜索引擎是如何工作的吗?事实上,它可以分为四个步骤:
1.抢
2.过滤
3.收录
4.排名
下面我将详细解释搜索引擎的四个步骤。
一:抢
我们都知道在搜索引擎中搜索可以找到我们想要的网站,那么搜索引擎是如何找到我们的网站的呢?没错,就是一个叫“蜘蛛”的软件。
1)概念:“蜘蛛”也叫爬行机器人,是一套信息抓取系统。互联网就像一张蜘蛛网,像“蜘蛛”一样在互联网上反复爬行,不知累到什么程度,所以叫网蜘蛛。这只蜘蛛喜欢原创和高质量的内容,这也是我们在编写软文时遵循的原则。
2)如何让蜘蛛爬行:
1.外部链接
我们可以在一些博客上做一些外部链接,贴吧等,当蜘蛛爬取这些网站时,它们会按照我们留给我们的网站的地址去爬取内容。
2.提交链接
网站完成后,我们可以在各大搜索引擎提交网站,告诉搜索引擎爬虫我们的网站已经完成,蜘蛛可以过来爬取了。
3.蜘蛛自己来了
完成第一步和第二步后,网站有了一定的优质内容和一定的信用积累后,蜘蛛就会养成从我们网站那里抓取内容的习惯,它们会自己来。
3)如何知道蜘蛛是否来了:
1.百度平台爬取频率
百度站长工具中有一个爬取频率工具,我们可以查询爬取次数、爬取时间等信息。
2.服务器日志
服务器一般提供网站日志下载功能。如果下载后看不懂,可以使用一些工具查看。
4)影响蜘蛛爬行的因素:
1.路径长度
虽然说搜索引擎可以识别长度为1000的路径地址,但如果我是搜索引擎,我不喜欢这么繁琐的url!此外,过长的网址不易记忆,影响用户体验。
2.路径类型
这我分为三类:静态、伪静态和动态。
静态网页是指我们的服务器中有一个与该页面对应的html文件。这样做的好处是:第一个一、有利于搜索引擎爬取,搜索引擎喜欢静态的url,而二、路径不会涉及到数据库查询,速度快,但是缺点是:占用服务器空间大,页面过多后管理困难。
动态:即URL会传递参数,然后连接数据库,然后返回查询结果并呈现在我们的网页上。这种方式虽然节省了服务器的空间,但是有查询数据库的过程,所以会比静态网页快。它速度较慢,而且搜索引擎不喜欢动态 URL。
最好的是伪静态。它具有静态和动态的优点。唯一的缺点就是数据库还需要查询,会影响速度。它有一个静态的 URL,不会占用大量的服务器资源。搜索引擎也喜欢这种形式的链接,所以伪原创现在被广泛使用在各大博客中,cms。
3.路径的层次结构
有的网站路径很深,到了6楼或者7楼,要很多次才能到最底页。一是不利于用户体验。其次,随着时间的推移,搜索引擎没有耐心去抓取这个网站,所以建议路径不要超过三层。
二:过滤
1)为什么要过滤:互联网上大量毫无价值的页面和死链接
互联网上的垃圾、重复、毫无价值的页面太多,如果没有过滤就全部发布,互联网就是垃圾场。所以这就是为什么我们在编写 软文 时尝试使用 原创 或伪 原创。有人说百度为什么不收录我的页面,先看你自己的内容,是否是优质内容,不要怪搜索引擎不收录,从找问题自己先。
2)影响因素:1.识别因素(代码图像)2.页面质量
三、收录
检查是否有办法成为 收录
1)site:首页地址,显示的页面都是百度收录页面,但是看比较麻烦,很难判断具体页面是否已经收录@ >。
2)站长工具背景
3)直接百度搜索链接,如果存在则页面为收录,如果链接不存在则页面不为收录,此方法只适用于你想查询不是 收录 的页面。
四、排名
分析比较,基本分
网站的页面通过前三级后,认为该页面为收录,然后搜索引擎根据页面内容质量、用户体验等因素对其进行排名,最后呈现在百度搜索的结果中。
在做SEO之前,我们必须链接搜索引擎是如何工作的。这将有助于我们在后期分析 网站 数据。当网站出现问题时,很容易找出问题出在哪个环节。