百度站长学院如何做好搜索引擎工作原理及SEOer分析
优采云 发布时间: 2021-06-27 00:27百度站长学院如何做好搜索引擎工作原理及SEOer分析
一.Engine 工作原理
百度站长学院对搜索引擎的原理有更详细的分析。总的来说,SEOer必须掌握的有以下几点。
1. 抓取网络。每个独立的搜索引擎都有自己的网络爬虫蜘蛛。爬虫跟踪网页中的超链接,从这个网站爬到另一个网站,通过超链接分析不断访问和获取更多的网页。抓取到的网页称为网页快照。因为超链接在互联网上的应用非常普遍,理论上从一定范围的网页开始,可以采集到绝大多数网页。
2.处理网页。搜索引擎抓取到网页后,还需要做大量的预处理工作,才能提供检索服务。其中,最重要的是提取关键词,构建索引库和index.html。其他包括去除重复网页、分词(中文)、判断网页类型、分析超链接以及计算网页的重要性/丰富度。
3. 提供搜索服务。用户输入关键词进行搜索,搜索引擎从索引库中找到与关键词匹配的网页;为方便用户,除了提供网页标题和网址外,还会提供网页摘要等信息。
二.当用户搜索关键词时,搜索引擎会做什么?
1.Submit网站Search。站长主动向搜索引擎提交网址,并在一定时间内向您的网站发送爬虫,扫描您的网站并将相关信息保存在数据库中,供用户查询。由于搜索引擎的索引规则与过去相比发生了很大变化,主动提交网址并不能保证您的网站可以进入搜索引擎数据库。所以,站长应该在网站内容上下功夫,让搜索引擎有更多的机会找到你,并自动发送你的网站收录。
2. 当用户使用关键词搜索信息时,搜索引擎会在数据库中进行搜索。如果找到符合用户要求的网站,就会使用特殊的算法——通常是根据网页中关键词的匹配程度、位置、频率、链接质量等——计算相关性和排名每个网页的级别,然后根据相关性将这些网页链接依次返回给用户。
三.搜索引擎喜欢收录什么样的页面?
优秀且独特的页面。如果您的页面内容与互联网上已经存在的其他页面高度相似,则可能无法被搜索引擎收录搜索到。链接级别较浅的页面。太深的链接,尤其是动态网页的链接,会被丢弃而不是收录。
如果是动态网页,请控制参数的数量和网址的长度。搜狗更喜欢收录静态网页。重定向次数多的页面更容易被搜索引擎丢弃。
四.哪些SEO行为会被判定作弊
隐藏文本/隐藏链接。一般是指网页为搜索引擎设计但普通访问者看不到的文字内容或链接。在各种隐藏技术中,最常见的是将文本或链接文本的字体颜色设置为与背景颜色相同或非常接近。其他方法包括使用超小文字、将文字置于图片层后、页面底部多余内容、滥用图片ALT等;
该网页与搜狗的描述不符。它通常发生在您首先向搜索引擎提交网站,然后在网站 为收录 之后将网站 替换为另一个页面时。一种常见的“诱饵行为”就是这种hacking——创建一个优化页面和一个普通页面,然后将优化页面提交给搜索引擎,当优化页面被搜索引擎收录替换为普通页面时。
误导关键词。使用与页面上的页面无关的误导性关键词来吸引查询主题的访问者访问网站。这种做法严重影响了搜索引擎提供结果的相关性和客观性,受到搜索引擎的痛恨。
重复关键词。这种作弊技术也被称为“关键词stacking 欺骗”。它利用搜索引擎关注网页正文和标题中的关键词,使关键词不合理(过度)重复。其他类似的方法包括在 HTML 元标记中堆叠大量关键字或使用多个关键字元标记来提高关键词 的相关性。这种技术很容易被搜索引擎发现并受到相应的惩罚。
恶意交换链接。在网页上建立大量互相网站的链接。
不可见页面。对实际访问者或搜索引擎隐藏真实的网站 内容,为搜索引擎提供不真实的搜索引擎友好内容,以提高排名。
欺骗性重定向。指快速将用户访问的第一页(着陆页)重定向到内容完全不同的页面。
日志欺诈。指在页面级别较高的网站上进行大量虚假点击,以列在这些网站的最高referrer日志中,从而获取其导入链接。
创建大量镜像网站复制网站或网页内容,分配不同的域名和服务器,诱使搜索引擎多次索引同一页面内容。
页面收录恶意广告、恶意代码或恶意插件
如果页面有作弊网站的链接,可能会被视为作弊网站。