seo网站日志分析工具(宝塔面板下载网站日志的办法方法同虚拟机下载(组图) )
优采云 发布时间: 2022-02-10 10:04seo网站日志分析工具(宝塔面板下载网站日志的办法方法同虚拟机下载(组图)
)
站长如何下载网站日志?如何分析 网站 日志?分析网站日志能做什么?
昨天分析了站长发来的近一个月的网站日志数据,发现日志可以帮助站长优化网站,然后直奔主题。
一、如何下载网站日志
1、虚拟主机下载网站日志
如果你使用的是虚拟主机,日志一般每天都保存在网站根目录的wwwlogs或logs文件夹中,你可以通过FTP工具下载。
2、宝塔面板的日志如何下载网站
方法类似于虚拟机下载网站日志,但需要先登录宝塔面板,然后在文件-根目录-wwwlogs中下载,如下图:
二、如何分析网站日志?
下载的网站日志需要经过处理才能看到数据,这里站长使用爱站的网站日志分析工具,可以下载爱站SEO Toolkit,收录日志分析工具。
具体使用方法是进入日志分析工具,导入需要分析的网站日志,然后根据需要点击分析查看蜘蛛数据。
比如蜘蛛爬取摘要、目录爬取数据、页面爬取数据、IP排名等。这里站长最关心的就是页面爬取数据。具体操作步骤如下:
选择查看页面抓取数据-只看百度蜘蛛-点击查询-导出数据
由于导出的数据是文本文档,为了更方便查看数据,我们将其导入到表格中进行处理,如图所示。
页面:指已经被搜索引擎抓取的页面
总爬取量:指当前页面被所有蜘蛛爬取的总量
蜘蛛爬取量:指百度蜘蛛已经爬取的数量
三、分析网站日志可以做什么?
接下来是最关键的部分,也就是根据网站日志数据优化网站站长发来分析网站日志经常关注的两点:
(一)比较爬取页面和站点地图中的url
(二)处理无效的抓取数据
(一):比较爬取页面中的url和sitemap中的url
步骤一、用&组合爬取页面的完整url,如下图
步骤 二、通过 网站 站点地图文件导出所有当前 网站 url
步骤 三、 使用 VLOOKUP 比较当前 网站 站点地图中哪些 URL 未被捕获。通过将爬取的页面与站点地图中的url进行比较,如果站点地图的url中有被爬取的页面,您可以重新向百度站长平台提交数据。
通过对比发现,站点地图中的所有网址都被百度蜘蛛抓取过。
因为站长每次发布文章都会提交百度站长平台,所以不难发现百度蜘蛛可以通过站长后台抓取网站频率。
所以问题来了。站长定期发布文章,百度蜘蛛也会抓取提交的数据,但是站长只有2个收录。
是什么原因?
一般来说,这种情况下没有收录的原因有两个。首先是从搜索引擎爬取页面到页面收录需要一个缓冲期;二是文章的质量不好。,百度蜘蛛认为被爬取后不一定是收录。
Step 四、 此时再次使用VLOOKUP,在fetched url表中对比sitemap中的url,然后查看抓取时间和抓取次数。
通过数据发现有很多页面比现在的收录文章更早发布,还有很多页面比他爬得更频繁,但是这些页面都没有被收录@ >,所以目前缺少网站收录的主要原因与文章的质量有很大关系。
(二): 处理无效的获取数据
在日志表中标记站点地图中已经爬取的url,然后过滤掉其他的url。通过过滤,可以整理出一组数据。近期百度蜘蛛对网站的总爬取次数为3743,中间url、根目录、robots文件共爬取1463次,其他页面共爬取2280次。
也就是说,61%的蜘蛛爬取了其他页面,那么这些页面是做什么的呢?如何处理?
1、大部分网址都是404页面,也就是说这些页面是打不开的。
2、这些页面路径不同,不能在robots中统一使用通配符屏蔽
于是站长发了一个最笨但最有效的方法,就是直接把这些url全部加到robots上。
到目前为止,站长如何下载网站日志?如何分析 网站 日志?分析网站日志能做什么?我希望能有所帮助。