网页被收录之前的分析搜索引擎的抓取标准的日志
优采云 发布时间: 2021-07-30 04:46网页被收录之前的分析搜索引擎的抓取标准的日志
1/5
分析搜索引擎的爬取日志
之前我们的网页是收录,作者认为需要被搜索引擎抓取和抓取。当搜索引擎抓取你的页面,觉得你的文章质量符合收录标准时,就会把你的网页收录放入它的索引库,经过处理后,给你的网页对应的关键词排名,通过日志分析,我们可以清楚的知道我们的哪些页面被爬取,哪些页面没有被爬取,以及网站各个目录的爬取状态,以便我们采取相应的措施来提升@搜索引擎中的收录。
2/5
在首页显示更多未抓取网页的网址
在上一步中,我们已经提取了未被抓取的网址列表,然后我们可以将这些网址显示在首页上,以增加被搜索引擎抓取的机会。主页上很多网站都是这样 最新的文章版块和随机展示版块其实大多是为了增加被搜索引擎抓取的机会,增加网站页面的收录。首页的权重是网站中最高的URL页面,往往是一样的。蜘蛛最活跃的页面,所以收录经常可以添加到首页显示中。
3/5
使用robots.txt文件和nofollow和noindex标签来辅助搜索引擎收录
看过搜索引擎原理书的人都知道,对于搜索引擎来说,它的资源是有限的。每天搜索引擎只能抓取互联网上的一部分网页,而在这个抓取的网页中,收录只是一部分,所以搜索引擎资源非常稀缺。在这种情况下,作者认为我们应该尽可能将我们最重要的页面的 URL 展示给搜索引擎,而对于一些没有收录 值的页面,您可以阻止其收录或阻止其跟踪,机器人文件和 nofollow 派上用场。比如一些没有收录意思的链接联系我们、企业招聘、登录、注册等,我们可以直接用nofollow来屏蔽搜索引擎跟踪,对于一些目录比如网站的模板目录,网站中的一些动态网址,我们可以使用robots直接拦截搜索引擎收录,也可以在页面头部添加noindex属性来防止搜索引擎收录,当我们拦截爬行的时候在这些所谓的无意义页面中,搜索蜘蛛会在我们网站上爬取更多有意义的页面,从而提高我们的有效收录。
4/5
发布更多网站list 页面 URL 链接
SOSO官方SEO指南中提到了这一点,这意味着我们可以专注于我们的列表页面,并且可以发送更多链接到某些列表页面,因为列表页面中的有效URL更多。当搜索引擎蜘蛛抓取列表页面时,它会抓取列表页面中的产品网址,从而增加我们的收录。
5/5
灵活调整搜索引擎的抓取频率
在Google网站Administrator Tools中,其中之一就是我们可以根据我们网站的情况来调整搜索引擎的抓取频率。默认情况下,谷歌会根据你的网站服务器识别情况并调整其抓取频率。它的原则是在你的服务器能承受的情况下尽量爬取。因此,如果我们想提高它的爬取频率,可以在这个Google网站管理同工具中进行调整。当然,这只能针对 Google。