seo优化搜索引擎工作原理(一下搜索引擎的工作原理吗?抓取2.过滤3.收录)
优采云 发布时间: 2021-12-26 19:10seo优化搜索引擎工作原理(一下搜索引擎的工作原理吗?抓取2.过滤3.收录)
你知道搜索引擎的工作原理吗?其实分解大致分为四步:
1.获取
2.过滤器
3.包括
4. 排名
下面我将详细讲解搜索引擎的这四个步骤。
一:爬行
大家都知道在搜索引擎中搜索可以找到我们想要的网站,那么搜索引擎是用什么来找到我们的网站的呢?是的,它是一种叫做“蜘蛛”的软件。
1) 概念:“蜘蛛”又称爬虫机器人,是一套信息爬取系统。互联网就像一张蜘蛛网,像“蜘蛛”一样在互联网上反复爬行。不知道有多累 ,所以被称为网络蜘蛛。这只蜘蛛喜欢的是原创、优质的内容,这也是我们写软文的原则。
2)如何让蜘蛛爬行:
1.外部链接
我们可以在一些博客、贴吧等做一些外链,蜘蛛在爬取这些网站的时候,会按照我们留下的地址来我们的网站爬取内容。
2.提交链接
网站建成后,我们可以将网站提交到各大搜索引擎,告诉搜索引擎爬虫我们的网站已经准备好了,蜘蛛可以过来爬取。
3.蜘蛛自己来
完成第一步和第二步后,当网站有了一定数量的优质内容和一定的信用积累后,蜘蛛就会养成爬取我们网站内容的习惯,它们就会自己来。
3)如何知道蜘蛛是否来了:
1.百度平台抓取频率
百度站长工具中有一个爬虫频率工具,我们可以查询爬虫数量、爬虫时间等信息。
2.服务器日志
服务器一般提供下载网站日志的功能。如果下载后不明白,可以使用一些工具查看。
4) 影响蜘蛛爬行的因素:
1.路径长度
虽然搜索引擎可以识别1000长度的路径地址,但如果我是搜索引擎,我不喜欢这么麻烦的网址!而且,过长的网址不易记忆,影响用户体验。
2.路径类型
我将其分为三类:静态、伪静态和动态。
静态网页意味着在我们的服务器中存在与该页面对应的 html 文件。这样做的好处是:第一个一、有利于搜索引擎抓取,搜索引擎喜欢静态URL,而二、的路径不是涉及到数据库查询,速度快,但是缺点是占用服务器空间大,页面多后难以管理。
动态:URL 会传递参数,然后连接数据库,然后返回查询结果并呈现在我们的网页上。这种方式虽然节省了服务器空间,但是有一个查询数据库的过程,所以速度比静态网页要快。它更慢,搜索引擎不喜欢动态 URL。
最好的是伪静态。它具有静态和动态的优点。唯一的缺点就是还要查询数据库,对速度会有一定的影响。它有一个静态URL,不占用大量服务器资源。搜索引擎也喜欢这种形式的链接,所以现在各大博客和CMS都广泛使用伪原创。
3.路径的级别
有的网站路径很深,达到6级和7级,需要很多点才能到达底页。第一,不利于用户体验。其次,时间一长,搜索引擎就没有耐心去爬这个网站了,所以建议你一个路径不要超过三层。
二:过滤
1)为什么要过滤:互联网上大量无价值的页面和死链接
互联网上有太多垃圾、重复和毫无价值的页面。如果不加过滤就全部发布,互联网就是垃圾场。所以这就是为什么我们在写软文时尽量做到原创或伪原创。有人说百度为什么不收录我的页面,先检查自己的内容,是否是优质内容,不要怪搜索引擎不收录,先自己找问题。
2)影响因素:1.识别因素(代码图)2.页面质量
三、包括
检查是否已收录
1)站点:首页地址,显示的页面都是百度收录的页面,但是查看起来比较麻烦,也很难判断某个特定页面是否被收录。
2)站长工具背景
3)直接百度搜索链接。如果存在,则收录
该页面。如果链接不存在,则不收录
该页面。此方法仅适用于您检查是否收录
某个页面。
四、 排名
分析比较,基础评分
网站某个页面通过前三个级别后,即使该页面被收录,搜索引擎也会根据页面内容的质量、用户体验等因素对其进行排名,最终出现在百度的搜索结果中。
在做 SEO 之前,我们必须链接到搜索引擎的工作原理。这有利于我们后期对网站数据的分析。当网站出现问题时,很容易找出问题所在。