解决方案:网站优化二-网站日志分析

优采云 发布时间: 2022-10-01 14:09

  解决方案:网站优化二-网站日志分析

  网站日志分析的功能一般包括:记录你的网站何时更新,你的网站是否被黑,记录谁点击了你的网站@网站,记录蜘蛛什么时候爬,爬多深,不会爬到那个页面下。这样,当你的网站发现蜘蛛长时间不爬的时候,你就可以找到问题的根源,找到根本原因,找到解决办法,而不是像无头苍蝇一样到处乱跑,还是等奇迹发生,首先蜘蛛不来抢,我们先看看百度的抢频率,是不是从那天起就没有抓到了?在不爬之前你有没有做过违反搜索引擎规则的事情……等等。这个系列与网站日志有关。

  1、使用日志分析工具-金华站长工具

  百度金花站长工具下载

  打开金华站长工具->数据分析->网站日志分析,选择日志文件目录

  2、分析是否收录

  比如1月31日发布的文章网站优化一——写好标题很重要。2月1号我会去查看网站log看看这个文章有没有被百度审核过收录

  找到 1 月 31 日的日志文件

  查看百度的爬取记录,如果不方便查找,也可以导出到excel中查找

  检查是否 收录

  3、404 错误

  

  404错误表示网页无法打开。可以检查网页地址是否发生变化,及时修复404错误,避免搜索引擎经常爬错网页,给搜索引擎留下不好的印象。

  状态码 200、304 成功

  4、日志文件大小

  日志文件的大小反映了网站的受欢迎程度,访问次数越大,日志文件越大。平时注意日志文件大小变化的趋势。如果它突然增加或减少很多,您可以使用它来查看导致它的原因。

  5、日志文件中收录的信息

  经过上面的讲解,大家应该对日志文件有了初步的了解,接下来我们会更专业的讲一下,一条标准的日志记录应该收录哪些信息

  远程主机的 IP 地址/名称(远程主机)

  日志名称

  登录全名

  请求发生的日期(日期)

  请求发生的时间(Time)

  与标准格林威治标准时间的差异(GMT 偏移量)

  请求方法

  请求文件的地址(File)

  

  要求遵守协议 (Protocol)

  请求的状态(Status)

  请求文件的长度(Length)

  以下是标准日志文件条目:

  2020-01-31 13:01:17 192.168.0.5 GET /news_view3.asp id=1381 80 - 220.18< @1.108.186 Mozilla/5.0+(兼容;+Baiduspider/2.0;++/search/spider.html) - 200 0 0 132

  由于服务器设置问题,格式会有所不同,但内容会相同。

  6、分析访客身份

  在一些特殊情况下,我们需要确认某个访问IP。下面的例子说明了。

  比如我用百度商务桥,每天看到一个北京IP访问我网站,每次只访问一个页面就退出

<p>记录这个IP:11

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线