seo网站日志分析工具(南京seo优化():常用的日志分析工具(组图))

优采云 发布时间: 2021-11-30 18:01

  seo网站日志分析工具(南京seo优化():常用的日志分析工具(组图))

  网站日志数据分析。南京seo优化

  

  1、网站日志中的数据量太大,所以我们一般需要使用网站日志分析工具来检查。常用的日志分析工具包括:光年日志分析工具、网络日志浏览器、WPS表格等。

  117.26.203.167 – – [02/May/2011:01:57:44 -0700] “GET/index.php HTTP/1.1 "500 19967"-""Mozilla/4.0(兼容;MSIE 8.0;Windows NT 5.1;Trident/4.0;AskTbCS-ST/5.11.3.15590;.NET CLR 2.0.50727;Alexa 工具栏)”

  分析:

  117.26.203.167访问ip;

  02/May/2011:01:57:44 -0700 访问日期-时区;

  GET/index.php HTTP/1.1 根据HTTP/1.1协议,抓取(域名下)/index.php页面(GET表示服务器动作);

  500 服务器响应状态码;

  服务器响应状态码通常有以下状态码:200、301、302、304、404、500等。200表示用户成功获取到请求的文件。如果是搜索引擎,就证明蜘蛛在这次爬行过程中成功发现了一些新的内容。而301表示用户访问的某个页面的URL被301重定向(永久),302是临时重定向。404 表示访问的页面不再存在,或者访问的 URL 是错误的。500 是服务器错误。

  19967 表示已经捕获了 19967 个字节;

  Mozilla/4.0(兼容;MSIE 8.0;Windows NT 5.1;Trident/4.0;AskTbCS-ST/5.11.3.15590; .NET CLR 2.0.50727; Alexa Toolbar是指访问者使用火狐浏览器和Alexa Toolbar等访问终端信息;

  2、如果你的日志格式不一样,说明日志格式设置不一样。

  3、 在很多日志中可以看到20000 0和20000 64都代表正常爬取。

  4、 爬取频率通过查看每日日志中百度蜘蛛爬取次数获得。爬行频率没有标准的时间表或频率编号。我们一般通过比较多天的日志来判断。当然,我们希望百度蜘蛛每天尽可能多地抓取。

  5、有时候我们的路径有无斜线不统一,蜘蛛会自动识别为301跳转到有斜线的页面,这里我们发现搜索引擎可以判断我们的目录,所以我们要统一我们的目录。

  6、 我们分析日志很久了,可以看到蜘蛛的爬行规则。可以看到同一目录下单个文件的爬取频率间隔和不同目录下的爬取频率间隔。这些爬行的频率间隔是由蜘蛛根据网站权重和网站更新频率自动确定的。

  7、 蜘蛛按层级顺序爬取我们的页面,按权重降序。一般顺序是首页、目录页、内页。

  (访问了 43 次,今天访问了 38 次)

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线