seo网站日志分析工具( 大部分seoer新手都不会网站日志的分析或者是只会用分析软件)
优采云 发布时间: 2021-09-10 11:16seo网站日志分析工具(
大部分seoer新手都不会网站日志的分析或者是只会用分析软件)
百度实战技术教程:晋升seo网站导演必之网站日志分析
网站日志分析对于seo数据分析也很重要,尤其是新战或者网站遇到一些需要分析的问题,但是大部分seoer新手不知道网站日志分析或者只能使用分析软件查看日志蜘蛛是否来了,网站页面的状态码是否正常。这是常见的新手朋友网站日志分析的过程。
网站日志的实战分析,可以观察到网站来找我们的搜索引擎蜘蛛的爬取情况,可以更密切的分析和联系蜘蛛。爬取次数、爬取时间点、爬取高峰期、爬取反映的HTTP状态码给我们带来清晰的分析方便。
案例日志:61.135.168.22--[11/Jan/2009:04:02:45 +0800] "GET /thread-7303-1-1.html HTTP /1.1" 200 8450 "-" "百度蜘蛛(+http:-www-baidu-com/search/spider.htm)"
分析:
1、61.135.168.22是访问服务器IP网站。
2、11/Jan/2009:04:02:45 表示蜘蛛爬行时间
3、GET /thread-7303-1-1.html HTTP,表示蜘蛛抓取了这个页面。
4、200 状态码表示蜘蛛抓取页面成功; 404表示蜘蛛抓取页面失败。
5、8450 表示这次捕获了 8450 个字节
6、Baiduspider(+http:-www-baidu-com/search/spider.htm)代表百度蜘蛛的名字
基本状态码:
200:请求已完成,蜘蛛正常访问页面
301:移动,永久重定向
302:临时重定向
304:蜘蛛爬取后,发现页面没有被修改
305:使用代理
400:请求错误
404:找不到页面
这里seo Manxue的编辑更详细的写了iis网站的日志分析过程:
用ultraedit打开后,按CTRL+F,弹出一个窗口(如图1),输入Googlebot,回车,新窗口显示的页面是google机器人的访问记录,选择一个其中,双击,可以看到访问的时间和页面(如2)所示,这里需要注意的是,显示的时间是国际标准时间,所以在这个时间上加上8小时,这样是北京时间,如果是你自己的独立服务器可以设置为北京时间,这里就不赘述了。
我们继续搜索百度蜘蛛,看看百度蜘蛛的爬取记录。其他搜索引擎搜索如雅虎、搜狗、msnbot、YodaoBot……比如我们新建了一个网站并在百度和谷歌提交,但是在网站上看不到收录的页面。这时候我们就可以用上面的方法来查看IIS日志了。只要百度、谷歌等搜索引擎的蜘蛛爬到了我们的网站,我们就不用担心网站的收录问题。搜索引擎会慢慢释放它。对于已经被抓取的页面,站长可以继续添加内容。通过本次搜索,您还可以了解搜索引擎访问的时间和频率以及页面抓取的时间和频率。
以上是通过IIS日志查看搜索引擎的爬取记录。可能有人会问,为什么流量统计工具不能统计搜索引擎的爬取记录?因为流量统计代码是JS调用的,搜索引擎蜘蛛爬取的JS文件不会被调用。我们可以自己写一个流量统计函数,然后将流量统计函数的动态页面收录到每个页面中,这样就可以统计到该页面的所有访问次数,通过agent参数可以判断是哪个搜索引擎来的从。详细。
通过IIS日志检查网站是否有死链接:
在用ultraedit打开的IIS日志文件中按CTRL+F,在出现的窗口中(如1)所示,选中第一个和第三个复选框,输入404,然后回车看看有没有在弹窗中找到任何记录,如果你找到了,就说明你的网站有死链接,大家都知道死链接对网站的收录有影响,所以我不'不用说怎么处理了吧。
以下是我在网站IIS日志中搜索404时出现的记录: