seo网站日志分析工具(略懂、确定是否有蜘蛛过来爬行如何确定?(图))
优采云 发布时间: 2021-09-15 23:05seo网站日志分析工具(略懂、确定是否有蜘蛛过来爬行如何确定?(图))
寻找A5项目招商,快速获得准确的代理名单
自从我从事SEO网站优化之后,慢慢关注网站日志网站日志分析已经成为您日常工作的第一件事。每天一到公司,你就会第一次分析昨天的网站日志。也许有些站长不能分析网站日志。对此,请参考发布的“稍微了解网站log分析,网站safe”,但一些人认为分析网站log是浪费时间。每天查看这些数据有什么用。在这里,我认为至少有四点我们可以理解
一、第一步是确定是否有爬行蜘蛛
如何确定蜘蛛是否正在爬行:
1、watch网站log代码,针对分析专家
2、watch通过网站log分析工具,更适合新手
通过网站log分析工具,您可以直接查看爬行器对站点的哪些页面进行了爬网
二、customer IP知道spider类型
1、22 0.18 1.10K28中的@百度蜘蛛@IP段(右起蜘蛛)
2、12 3.12 5.71.IP段中的@百度蜘蛛(次文章catch spider)
3、12 3.12 5.6K28中的@百度蜘蛛@IP部分(调查蜘蛛)
4、11 7.2 8.25K31中的@Baidu蜘蛛@IP部分(假蜘蛛)
5、
三、测试页状态是否正常
通过URL日志,我们可以直接看到服务器响应代码,哪些页面是错误的,哪些是正常的。一般情况下,如果返回的状态码为200,则表示正常。如果出现404,则表明页面上存在问题
四、搜索引擎对网站的友好度
从网站log中,我们可以直接看到蜘蛛爬到我们站点的时间。爬行次数越多,蜘蛛对我们的网站就越友好
从上图中,我们可以直接看到我们网站上蜘蛛的爬行时间,但是爬行时间中也有假蜘蛛,所以我们还需要通过客户IP确认哪些蜘蛛是真的,哪些是假的。您可以参考“稍微了解网站log analysis,网站more secure”,它有一个关于如何区分正确和错误爬行器的图形教程,这里将不介绍
通过对以上三点的了解,小编进一步探讨了以上四点:
对于上面的一、我们可以直接检查哪些页面被爬网了,哪些没有。随着算法的不断更新,新网站的调查周期越来越长,很多新站长通过site:domain name更新文章和check收录都不显示。这主要是因为搜索引擎陷入困境,没有及时发布
对于上面的二、,我们可以通过客户IP识别站点安全信息和文章内容的质量
根据不同的IP地址,我们可以分析网站是什么状态。以下是常见的百度蜘蛛IP地址:
1、12 3.12 5.68.*经常出现,但很少有其他人出现,因此该网站进入沙箱或被降级的可能性非常高
2、22 0.18 1.68.*每天只有增加而不是减少是进入沙箱或减少的迹象
3、22 0.18@1.k38*、123. 125. 66.*搜索引擎开始抓取东西
4、12 1.1 4.89.*取消了新车站的检查期
5、20 3.20 8.60.*站点启动异常
6、21 0.7 2.225.*该IP段持续巡逻所有站点
7、22 0.18 1.108.*高质量文章内容页或主页捕获
通常,成功爬网的返回码为200000。如果返回状态显示304 00,则表示网站没有更新。蜘蛛来了,但没有爬行。如果是200064,别担心。这只是一些动态页面的抓取
对于上面的三、来说,如果服务器返回状态,例如,200表示正常访问。404表示该页不存在。304表示该网页尚未更新。这些可以通过网站log中的代码直接看到。如果出现大量404,则非常有必要对这些404页面采取措施。我们可以使用robots.txt协议屏蔽这些页面,并防止搜索引擎抓取此页面
对于上面的四、真蜘蛛,你来的次数越多越好
好的,将引入网站日志网站日志可以通过以下两种方式获得:
1、FTP空间日志文件夹
2、登录到站点的服务器,通常是网站日志位置C:windows-system32-logfiles
尊重原创,指出来源,你正在努力净化互联网环境。此文章由运营部编制发布,文章启动crown -关注SEO和SEM优化的发展趋势,分享营销推广技巧博客,并第二次将其发送至A5 ,@K9文章. 请留下原创链接以便重印。谢谢你的合作~
申请创业报告,分享好的创业理念。单击此处讨论创业的新机会