seo网站日志分析工具(分析网站日志能获取到的信息总结:一个)
优采云 发布时间: 2022-01-23 17:02seo网站日志分析工具(分析网站日志能获取到的信息总结:一个)
一个seo工作者,尤其是拥有大网站的人,能够独立分析网站日志是一项必备技能,因为大网站的列结构和页面非常复杂,蜘蛛难免会访问频繁地。从蜘蛛给网站留下的痕迹,可以控制网站的很多信息,对于网站的优化操作很重要,必要的参考,之前小星星的文章 也对蜘蛛状态码做了初步的介绍。这个文章 还总结了网站 日志中可以读取的信息。:
分析网站日志可以得到的信息汇总:
一、你可以看到哪些搜索引擎蜘蛛爬到了网站的页面
从 网站 日志中,我们可以看到 网站 被哪些蜘蛛爬行。每种蜘蛛都有自己的特殊标头。各大搜索引擎的头部特征如下:
百度蜘蛛:baiduspider
谷歌蜘蛛:谷歌机器人
360蜘蛛:360蜘蛛
SOSO蜘蛛:Sosospider
雅虎蜘蛛:“雅虎!啜饮中国”或雅虎!
有道蜘蛛:有道机器人、有道机器人
搜狗蜘蛛:搜狗新闻蜘蛛
MSN 蜘蛛:msnbot、msnbot-media
必应蜘蛛:bingbot
温馨提示:网站的日志也可能被其他一些私人开发的爬虫爬取,所以我们可能会发现一些奇怪的蜘蛛爬取痕迹。另外,百度也有自己的匿名蜘蛛,我们也要注意区分。
二、可以统计网站目录蜘蛛爬取的总数
通过对爬取总量的分析,可以比较出哪个目录网站更受搜索引擎关注。一般来说,爬虫爬取目录越频繁,站点网站这个目录的排名就会比较高。我们也可以通过蜘蛛对目录的访问量来适当调整目录的结构。对于那些爬取压力大但不是很重要的目录,也可以适当减少链接入口,以免妨碍其他重要目录的爬取。
三、网站 抓取页面。
可以看出是哪个页面蜘蛛爬到了一些收录不重视的页面,或者重复爬过这些页面等等,那么同样应该采取措施经常关闭它们,或者应用nofollow标签,或robots文件等,这将减少影响页面权重传递的不利影响,因为搜索引擎会抓取大量相关性低或质量差的页面。
四、蜘蛛抓取页面的平均次数,页面的平均停留时间,爬取次数。
(1),平均每次爬取的页面数=总爬取量/访问次数
(2),单页爬取停留时间
(3),页面平均停留时间=总停留时间/访问次数
从上面的分析可以清楚的看出,蜘蛛是否频繁关注其网站,爬取的页面越多,深度越深,也能体现出网站的活跃度高,而还停留在 网站 和 文章 的页面是新奇还是原创,这也是页面质量的体现。
五、可以在spider端列出每个网页的状态码
状态码是网站日志最重要的方面,是蜘蛛对网站页面状态最直观的反映。从这些状态码中可以看到更详细的信息。
六、了解网站日志蜘蛛的访问次数
在对网站的每日日志的分析总结中,很直观的看出哪个时间段是每天蜘蛛访问的高峰期。为了迎合搜索引擎,我们也可以相应地调整网站的更新时间。尽量在蜘蛛最活跃的时候更新文章,对你网站的收录有很大帮助,甚至可以达到秒关的效果!
总之,分析网站日志是一个很有意义的技能,尤其是在网站建立初期,操作遇到情况,分析日志就更重要了,当然,遇到信息的时候体积特别大的时候,用手看效果不好。这里推荐光年日志分析工具,功能非常强大,基本可以满足一般网站的分析需求。