seo网站日志分析工具(什么是网站日志对于网站建设的作用监控对我们的房间)
优采云 发布时间: 2022-03-18 19:04seo网站日志分析工具(什么是网站日志对于网站建设的作用监控对我们的房间)
什么是网站日志
网站构建网站的日志功能相当于我们房间的监控*敏*感*词*。可以记录这段时间所有来过我们家的访客的记录。
然后我们有网站每天有很多用户访问,还有很多搜索引擎蜘蛛每天都在爬日志。什么浏览器,什么操作系统,什么时间访问,访问了哪些页面?日志可以记录所有这些数据。
同时搜索引擎的蜘蛛来爬取,是百度搜索引擎的蜘蛛,还是谷歌或360的?什么时候来爬取,什么时间爬取了哪些页面,爬取的时候返回值是多少?无论是否正常打开,所有这些数据都可以记录在一个叫做日志的文件中。
网站如何分析日志
1.网站日志下载与数据解读
分析网站日志,我们可以了解搜索引擎蜘蛛在访问我们时得到了哪些信息网站? 网站 和搜索引擎之间是怎样的对话,如何分析 网站 日志,从哪里下载这些数据?
通过 FTP 访问 网站 的根目录。您可以看到一个收录日志的文件夹,这是存储日志的位置。
如何查看网站日志
下载、解压并打开日志文件,日志文件内容如下:
61.135.168.22 - - [11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1- 1.htmlHTTP/1.1" 200 8450 "-" "Baiduspider+(+)" (注:百度,此部分为本文添加)
203.208.60.43 - - [11/Jan/2009:04:02:43 +0800] "GET /sns/space-13563-do- friend-view-me.html HTTP/1.1" 200 5162 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +)" (注:Google)
202.160.178.21 - - [11/Jan/2009:04:02:44 +0800] "GET /sns/space.php?uid= 323 HTTP/1.0" 200 7535 "-" "Mozilla/5.0(兼容;Yahoo! Slurp China;)"(注:Yahoo)
65.55.220.217 - - [11/Jan/2009:04:02:57 +0800] "GET /ucenter/avatar.php?uid= 12373&size=small&type=virtual HTTP/1.1" 301 - "-" "msnbot-media/1.1 (+)" (注:MSN)
65.55.109.46 - - [11/Jan/2009:04:02:57 +0800] "GET /sns/source/script_menu.js HTTP /1.0" 200 7219 "http:/sns/space-5755-do-blog-view-me.html" "Mozilla/4.0 (兼容; MSIE 6.0; Windows NT 5.2;SV1;.NET CLR 1.1.4322)
大概就是上面密密麻麻的代码,但是这些代码怎么理解。比较容易理解,我们来看看这串日志的内容。前面的ip表示今天访问我们的网站,是什么ip?不管是用户还是搜索引擎蜘蛛,它都有一个ip,就是记录他的ip。后者是一个时间点,什么时候访问我们的网站?那么get就是抓取,抓取的是哪个文件呢?该文件已被抓取。
这是我们域名下的内容,把这个文件拿回来。爬回来之后,200,这是http状态码,表示爬取成功,然后后面的数字表示已经爬取了多少字节?那个200,然后这个8000多的意思就是成功抓到了8000多字节,大概是我们一个网页的大小。后一段代表蜘蛛,百度蜘蛛代表百度的蜘蛛。这句话的意思是百度蜘蛛来抢内容,成功抢了这么多字节。
好的,那么当我们再次查看它时,我们可以看到这只蜘蛛是谁,yahuspider 是雅虎的,并且在这个时间点上。谁在上面?谷歌的,对吧?看看底部,我看不出这是哪个具体的搜索引擎。这是谁?你看这有 MSIE6.0。意思是微软的ie6.0,是用户正在爬取和访问的页面。
所以日志就是这样一个文件,它记录了用户和蜘蛛在一天中的每一刻网站来爬我们的所有情况。
2.分析网站什么是日志工具?
此日志文件看起来密集且费力。一般人是无法理解的。而如果我们的网站访问量非常大,日志的大小往往会达到几十兆、几百兆甚至几千兆。那么当我们在电脑上打开它时,有时电脑会死机。然后会用到网站日志分析工具。
一般分析网站我们使用光年日志工具来分析日志。关于这个工具的使用,可以阅读这篇百度经验了解,也可以去搜外的网站看看有免费教程。