seo网站日志分析工具(网站日志最大解读()日志解读)

优采云发布时间: 2022-01-18 18:07

　　网站可以使用工具或直接查看日志。直接看源文件，信息会更全。网站日志是一个以.log结尾的文件，记录了Web服务器接收和处理请求、运行时错误等各种原创信息。…

　　网站可以使用工具或直接查看日志。直接看源文件，信息会更全。网站日志是以.log结尾的文件，记录了Web服务器接收和处理请求、运行时错误等各种原创信息。准确地说，应该是服务器日志。

　　网站日志最大的意义就是记录网站的操作中对空间等的操作，以及访问请求的记录。通过网站日志，可以清楚的知道用户在什么IP下访问了你网站的哪个页面，什么时间，什么操作系统，什么浏览器，使用什么分辨率的显示器，是否访问成功.

　　网站日志中的很多信息已经在百度统计、百度站长工具等中进行了数字化或图形化处理，比如访问者访问了哪些文件，蜘蛛抓取了哪些文件并显示404等。

　　网站日志数据分析解释如下。

　　（1) 访问、停留时间、爬行

　　从这些item的数据我们可以知道：每次爬取的平均爬取页数、单页爬取停留时间和每页的平均停留时间。平均每次爬取页面数=总爬取次数/访问次数，单页爬取停留时间=每次停留/每次爬取，每次平均停留时间=访问总停留时间。

　　从这些数据中我们可以看到蜘蛛的活跃度、网站对蜘蛛的亲和度、爬取深度等，总爬取量、总访问量、平均爬取量、总停留时间、单次页面抓取停留指数、平均停留时间等越高，通常表明网站友好度越好，网站质量越高，搜索引擎越喜欢。单页抓取停留时间表示网站页面访问速度和时间较长，说明网站访问速度较慢，不利于搜索引擎抓取收录 . 我们应该尽力改进网页。加载速度，减少单页耗时，让爬虫资源爬得更多收录。此外，根据这些数据，我们还可以统计网站在一段时间内的整体趋势表现，比如蜘蛛访问趋势、停留时间趋势、爬取趋势。长期观察这些数据可以起到评估优化效果的作用，及时发现哪些页面和目录表现良好，哪些表现不佳。

　　(2) 目录爬取统计

　　通过日志分析，我们可以看到网站哪些目录被蜘蛛青睐，爬取目录的深度，重要页面目录的爬取状态，无效页面目录的爬取状态等。通过对比页面爬取和< @收录目录中的条件，我们可以发现更多的问题。对于重要的目录，我们需要通过内外调整来增加权重和爬取；对于无效页面，在 Robots.TXT 中阻止它们。

　　另外，通过多日日志统计，可以看到内外行为对目录的影响，优化是否合理，是否达到了预期的效果。对于同一个目录，在一个长期的时间段内，我们可以看到目录中页面的性能，以及基于行为推测的性能原因。

　　(3) 网页抓取

　　在网站的日志分析中，我们可以看到蜘蛛爬取的具体页面。从这些页面中，我们可以分析出蜘蛛抓取了哪些页面需要禁止抓取，抓取了哪些无值收录的页面，抓取了哪些重复的页面URL。为了充分利用蜘蛛资源，我们需要在Robots.txt中禁止抓取这些地址。

　　另外，我们还可以分析页面不是收录的原因。对于新的文章，是因为没有爬到收录，或者爬到了没有释放。对于一些阅读没有意义的页面，也许我们需要它作为爬取通道。对于这些页面，我们是否应该做Noindex标签等等。

　　(4)蜘蛛访问IP

　　通过蜘蛛的IP段和前三个数据判断网站的降级，IP分析更多用于判断是否有采集蜘蛛、假蜘蛛、恶意点击蜘蛛等。访问来源为屏蔽和禁止访问，节省带宽资源，减轻服务器压力，让访问者和蜘蛛有更好的访问体验。

　　(5)访问状态码

　　蜘蛛经常出现的状态码包括301、404等，这些状态码要及时处理，以免对网站造成不良影响。

　　(6)爬取时间段

　　通过分析比较多个单日蜘蛛每小时的爬取量，我们可以知道特定蜘蛛对于这个网站在特定时间的活跃期。通过比较每周的数据，可以看到特定蜘蛛在一周内的活跃周期。知道了这一点，对在线判定具有指导意义，而之前所谓的小三、小四，都是不科学的说法。

　　(7) 蜘蛛爬行路径

0

2022-01-18

seo网站日志分析工具

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

seo网站日志分析工具(网站日志最大解读()日志解读)

0 个评论

发起人

AI时代内容工厂

seo网站日志分析工具(网站日志最大解读()日志解读)

0 个评论

发起人

相关问题