seo优化搜索引擎工作原理(百度为例分享一下搜索引擎工作原理及工作流程详解工作)
优采云 发布时间: 2021-12-17 20:22seo优化搜索引擎工作原理(百度为例分享一下搜索引擎工作原理及工作流程详解工作)
目前主流的搜索引擎有:Baiduspider(百度蜘蛛的名字)、Googlebot(谷歌蜘蛛的名字)、360Spider(360好搜蜘蛛的名字)、搜狗新闻蜘蛛(腾讯旗下的搜狗蜘蛛的名字)、Yahoo! Slurp China”或者Yahoo(雅虎蜘蛛的名字)、YoudaoBot(蜘蛛的名字)等等,你可以称这些网络蜘蛛,它们可以抓取互联网上的内容。
下面以百度为例,分享一下搜索引擎的工作原理:
一、 抓取:
搜索引擎的主要功能是方便用户查找信息。要想获得蜘蛛程序的优先爬取,必须保证服务器速度,页面路径尽量短,减少爬取深度。也可以使用百度站长平台提交网址,加快蜘蛛爬行。注意:不想被蜘蛛爬取的内容需要做出robots协议。
二、。筛选:
搜索引擎抓取页面后会过滤所有内容,过滤掉以下内容:
1、 无价值页面,匹配度低、相关度低的页面会被过滤掉;
2、死链接:随意删除文章后形成的死链接,改变网站的路径形成的未打开页面;
3、 欺骗性页面:文字不正确的页面;
4、关键词 堆叠页面;
5、垃圾邮件链接。
三、收录:
您必须确保网页内容可以被蜘蛛识别,才能让收录受益。只有有收录,才有排名。收录是保证排名的前提;拥有 收录 不一定有排名。
1、正文:正文为排名主题;
2、图片:蜘蛛无法识别图片。必须添加 ALT 属性。单独添加ALT属性不利于排名。文字太少,不专业。图片永远是一个辅助功能,一定是图文结合,文字少的时候要加一些辨识度高的关键词。记住:文字是排名的主题;
3、Flash:蜘蛛无法识别视频播放器和*敏*感*词*。一个网页最多可以显示1~2个视频。必须显示视频介绍和评论。当蜘蛛不能识别的内容时,文本必须是主体;
4、JS:脚本特效,虽然很酷,但是蜘蛛认不出来。如:百度商桥、悬浮窗、对联广告等,新站不能投放广告,如有垃圾网站的嫌疑,排名顺延。
四、排序:
执行完上述步骤后,Spider 将开始排序。要想有好的排名,就必须严格遵守以上原则,灵活运用。收录 和排序的关系是收录关系。可以先按收录排序,即创建索引。收录 的数量大于索引的数量。