seo网站日志分析工具(网站日志最大解读()日志解读)
优采云 发布时间: 2022-01-18 18:07seo网站日志分析工具(网站日志最大解读()日志解读)
网站可以使用工具或直接查看日志。直接看源文件,信息会更全。网站日志是一个以.log结尾的文件,记录了Web服务器接收和处理请求、运行时错误等各种原创信息。…
网站可以使用工具或直接查看日志。直接看源文件,信息会更全。网站日志是以.log结尾的文件,记录了Web服务器接收和处理请求、运行时错误等各种原创信息。准确地说,应该是服务器日志。
网站日志最大的意义就是记录网站的操作中对空间等的操作,以及访问请求的记录。通过网站日志,可以清楚的知道用户在什么IP下访问了你网站的哪个页面,什么时间,什么操作系统,什么浏览器,使用什么分辨率的显示器,是否访问成功.
网站日志中的很多信息已经在百度统计、百度站长工具等中进行了数字化或图形化处理,比如访问者访问了哪些文件,蜘蛛抓取了哪些文件并显示404等。
网站日志数据分析解释如下。
(1) 访问、停留时间、爬行
从这些item的数据我们可以知道:每次爬取的平均爬取页数、单页爬取停留时间和每页的平均停留时间。平均每次爬取页面数=总爬取次数/访问次数,单页爬取停留时间=每次停留/每次爬取,每次平均停留时间=访问总停留时间。
从这些数据中我们可以看到蜘蛛的活跃度、网站对蜘蛛的亲和度、爬取深度等,总爬取量、总访问量、平均爬取量、总停留时间、单次页面抓取 停留指数、平均停留时间等越高,通常表明网站友好度越好,网站质量越高,搜索引擎越喜欢。单页抓取停留时间表示网站页面访问速度和时间较长,说明网站访问速度较慢,不利于搜索引擎抓取收录 . 我们应该尽力改进网页。加载速度,减少单页耗时,让爬虫资源爬得更多收录。此外,根据这些数据,我们还可以统计网站在一段时间内的整体趋势表现,比如蜘蛛访问趋势、停留时间趋势、爬取趋势。长期观察这些数据可以起到评估优化效果的作用,及时发现哪些页面和目录表现良好,哪些表现不佳。
(2) 目录爬取统计
通过日志分析,我们可以看到网站哪些目录被蜘蛛青睐,爬取目录的深度,重要页面目录的爬取状态,无效页面目录的爬取状态等。通过对比页面爬取和< @收录 目录中的条件,我们可以发现更多的问题。对于重要的目录,我们需要通过内外调整来增加权重和爬取;对于无效页面,在 Robots.TXT 中阻止它们。
另外,通过多日日志统计,可以看到内外行为对目录的影响,优化是否合理,是否达到了预期的效果。对于同一个目录,在一个长期的时间段内,我们可以看到目录中页面的性能,以及基于行为推测的性能原因。
(3) 网页抓取
在网站的日志分析中,我们可以看到蜘蛛爬取的具体页面。从这些页面中,我们可以分析出蜘蛛抓取了哪些页面需要禁止抓取,抓取了哪些无值收录的页面,抓取了哪些重复的页面URL。为了充分利用蜘蛛资源,我们需要在Robots.txt中禁止抓取这些地址。
另外,我们还可以分析页面不是收录的原因。对于新的文章,是因为没有爬到收录,或者爬到了没有释放。对于一些阅读没有意义的页面,也许我们需要它作为爬取通道。对于这些页面,我们是否应该做Noindex标签等等。
(4)蜘蛛访问IP
通过蜘蛛的IP段和前三个数据判断网站的降级,IP分析更多用于判断是否有采集蜘蛛、假蜘蛛、恶意点击蜘蛛等。访问来源为屏蔽和禁止访问,节省带宽资源,减轻服务器压力,让访问者和蜘蛛有更好的访问体验。
(5)访问状态码
蜘蛛经常出现的状态码包括301、404等,这些状态码要及时处理,以免对网站造成不良影响。
(6)爬取时间段
通过分析比较多个单日蜘蛛每小时的爬取量,我们可以知道特定蜘蛛对于这个网站在特定时间的活跃期。通过比较每周的数据,可以看到特定蜘蛛在一周内的活跃周期。知道了这一点,对在线判定具有指导意义,而之前所谓的小三、小四,都是不科学的说法。
(7) 蜘蛛爬行路径