SEO中最重要的知识理论--搜索引擎工作原理

优采云 发布时间: 2021-07-09 23:02

  SEO中最重要的知识理论--搜索引擎工作原理

  搜索引擎的工作原理

  当我们开始做SEO的时候,稍微了解一下我们就很容易忽略SEO中最重要的知识理论——搜索引擎的工作原理。了解搜索引擎的工作原理,那么当我们遇到问题的时候,我们就会知道问题的原因,我们就可以更好的优化我们的网站。一个搜索引擎通常由以下模块组成:

  

  1、Grab 模块

  2、过滤模块

  3、收录module

  4、sorting 模块

  1、1 抓取模块

  1、搜索引擎爬虫:蜘蛛

  搜索引擎要想自动抓取互联网上亿万个网页,就必须有一个全自动的网页抓取程序。而这个程序一般叫做“蜘蛛”(也叫“机器人”)。不管它被称为蜘蛛还是机器人,只要记住它指的是搜索引擎的爬虫。 (不同的搜索引擎叫法不同,如下:)

  

  谷歌--谷歌机器人百度--百度蜘蛛360--360蜘蛛

  2、如何让蜘蛛爬到我们的网站

  外部链接:将您自己的网站 链接发布到网站 已被收录 搜索以吸引蜘蛛的链接。 (常用方法:交换友情链接) 提交链接:我们通过链接提交工具提交给百度,百度会派蜘蛛抓取我们的网站。百度网址提交工具网址:

  蜘蛛自己爬行:如果想让蜘蛛定期在自己的网站主动爬行,必须提供高质量的网站内容。

  3、你怎么知道蜘蛛来我们网站

  (1)百度爬虫频率工具更改工具网址为:(2)Server log IIS log 如果服务器开启了IIS日志功能,可以通过IIS日志文件查看蜘蛛的踪迹。

  4、影响蜘蛛爬行的因素

  哪些因素可能导致蜘蛛无法正常抓取我们的网页,我们应该注意以下几点:(1)URL不能太长:百度建议URL长度不要超过256字节(一个英文占一个词)section,一个中文占两个字节)例子:蜘蛛喜欢:蜘蛛不喜欢:(2)网址中不收录中文:百度对中文网址的抓取效果比较差。(3)服务器质量差) : 浏览时总是打不开或者打开速度很慢,影响蜘蛛爬取效果(4)Robot.txt 拦截:由于SEO人员的疏忽,百度想在Robot.txt中抓取的页面。 (5)避免蜘蛛难以解析的字符:如%JKSHKLSHI%.html(6)动态参数不要太多太复杂:太多太复杂的路径容易被认为不重要)并被蜘蛛遗弃。

  1、2过滤模块

  为了保证用户和搜索引擎需要自己的存储资源,蜘蛛过滤掉了爬回没有内容、质量低的页面的功能模块,即过滤模块(1)I不擅长识别图片和链接。我不擅长识别蜘蛛,很可能被过滤为垃圾邮件网站。(2)内容质量也会在识别内容的基础上抓取网页内容,并且database 比较数据库中的内容,如果与数据库中的内容重复最多,则过滤掉。

  1、3收录module

  通过过滤模块“评估”出来的网页,进行分词和数据格式标准化,然后存储到索引数据库中。程序模块,我们称之为收录模块。

  1、如何判断一个网页是否是收录

  搜索这个网址,复制到百度搜索框搜索。

  

  2、如何查看网站的收录量

  (1)site 命令通过“site:domain name”命令,我们可以看到搜索引擎已经抓取到了某个域名下的页面收录量。(2)index 量查询工具(3)收录量少怎么办? a. 一般新站刚上线,1-2个月到收录,前期只有收录是首页。百度特意加长,防止垃圾站泛滥。审核期间,只需要提供优质内容即可。 b.老站收录量低,质量差造成的网页内容,网站的内容质量应尽快调整。

  

  

  1、4 排序模块

  对于存储在数据库中的页面,通过一系列算法得到每个页面的权重,将它们排序的程序称为排序模块。

  1、完美基础优化

  想要获得好的排名,首先要做好网页的基础优化,包括:网站location、网站结构、网站布局、网站code、网站content 等

  2、好综合数据

  在做好基础优化的基础上,加上你的百度统计后台数据表现良好,用户忠诚度和站外推广效果显着,你会在采集线上加分,这就是有利于排名。

  1、5Summary

  了解搜索引擎的原理有什么用?就是当你遇到一些SEO技术问题时,可以通过搜索引擎的原理找到原因,轻松应对。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线