js抓取网页内容(ajax请求的所有状态码详解(二)请求详解)

优采云 发布时间: 2022-01-18 18:15

  js抓取网页内容(ajax请求的所有状态码详解(二)请求详解)

  ajax请求的状态码有:100(继续)、101(切换协议)、200(成功)、201(创建)、205(重置内容)、301(永久移动)、400(错误请求)、401(未授权) )、403(禁止)、500(内部服务器错误)、502(错误网关)等。

  

  本教程的运行环境:windows7系统,javascript1.8.version 5,戴尔G3电脑。

  ajax请求所有状态码详解

  1XX(临时响应):

  指示临时响应并要求请求者继续操作的状态码;

  100(继续):请求者应继续请求。服务器返回此代码表示请求的第一部分已收到,正在等待其他部分;

  101(切换协议):请求本次请求切换协议,服务器已经确认,真正切换;

  2XX(成功):

  表示请求处理成功的状态码;

  200(成功):服务器已成功处理请求。通常,这意味着服务器提供了所请求的网页。如果您的 robots.txt 文件显示此状态代码,则表示 Googlebot 已成功检索该文件。

  201(created):请求成功,服务器创建了新资源。

  202(接受);服务器已接受请求但尚未处理。

  203(未经授权的信息):服务器已成功处理请求,但返回的信息可能来自其他来源。

  204(No Content):服务器成功处理请求,但没有返回任何内容。

  205(Reset Content):服务器成功处理请求,但没有返回任何内容。与 204 响应不同,此响应要求请求者重置文档视图(例如,清除表单内容以输入新内容)。

  206(部分):服务器成功处理了部分 GET 请求。

  3xx(重定向)

  要完成请求,需要采取进一步行动。通常,这些状态代码用于重定向。Google 建议您对每个请求使用不超过 5 个重定向。您可以使用 网站管理工具查看 Googlebot 是否在抓取重定向页面时遇到问题。诊断下的网络抓取页面列出了 Googlebot 由于重定向错误而无法抓取的网址。

  300(多选):服务器可以对请求执行各种动作。服务器可以根据请求者(用户代理)选择一个动作,或者提供一个动作列表供请求者选择。

  301(永久移动):请求的网页已永久移动到新位置。当服务器返回此响应(对 GET 或 HEAD 请求)时,它会自动将请求者重定向到新位置。您应该使用此代码告诉 Googlebot 页面或 网站 已永久移动到新位置。

  302(临时移动):服务器当前正在响应来自不同位置的网页的请求,但请求者应继续使用原创位置进行未来的请求。此代码类似于响应 get 和 head 请求的 301 代码,并且会自动将请求者带到不同的位置,但不应用于告诉 googlebot 页面或 网站 已移动,因为 googlebot 将继续爬取原创位置和索引。

  303(查看其他位置):当请求者应该对不同位置使用单独的 get 请求来检索响应时,服务器会返回此代码。对于头部以外的所有请求,服务器会自动转到其他位置;

  304(未修改):自上次请求以来,请求的页面没有被修改。当服务器返回此响应时,不返回任何页面内容;如果自请求者的最后一次请求以来页面未更改,则服务器应配置为返回此响应(称为 if-modified-Since HTTP 标头)。服务器可以告诉 googlebot 该页面自上次抓取以来没有更改,从而节省了带宽和开销。

  305(使用代理):请求者只能使用代理访问所请求的网页。如果服务器返回这个响应,也表明请求者应该使用代理。

  307(临时重定向):服务器当前正在响应来自不同位置的网页的请求,但请求者应继续使用原创位置来响应未来的请求。此代码类似于响应 get 和 head 请求的代码,将自动重定向请求者。到不同的位置,但不应告诉 googlebot 页面或 网站 已移动,因为 googlebot 将继续抓取原创位置并将其编入索引。

  4xx(请求错误)

  这些状态码表明请求可能出错,阻止服务器处理它

  400(Bad Request):服务器不理解请求的语法;

  401(未授权):请求需要认证;对于登录后请求的页面,服务器可能会返回辅助响应;

  403(禁止):服务器拒绝了请求。如果您在 googlebot 尝试在 网站 上抓取有效页面时看到此状态代码(您可以在 google网站Admin Tools Diagnostics 下的网络抓取页面上看到此状态),则服务器可能被主机拒绝谷歌机器人访问;

  404(未找到):

  405(Method Disabled):禁用请求中指定的方法;

  406(Not Accepted):请求的网页无法以请求的内容属性响应;

  407(需要代理授权):此状态码类似于 401(未授权),但指定应授权请求者使用代理。如果服务器返回这个响应,也说明请求者应该使用代理;

  408(请求超时):服务器在等待请求时超时;

  409(冲突):服务器在完成请求时遇到了冲突。服务器必须在响应中收录有关冲突的信息。服务器可能会返回此代码以响应与先前请求冲突的 PUT 请求,以及两个请求之间的差异列表;

  410(已删除):如果请求的资源已被永久删除,则服务器返回此响应。此代码类似于 404(未找到)代码,但有时在资源曾经存在但现在不存在的情况下代替 404 代码。如果资源已被永久移动,则应使用 301 指定资源的新位置;

  411 (valid-length required):服务器不接受没有payload-length头域的请求;

  412(precondition not met):服务器不满足请求者在请求中设置的前提条件之一;

  413(Request entity is too large):服务器无法处理请求,因为请求实体太大,超出了服务器的处理能力;

  414(The requested url is too long):请求的URI(通常是一个URL)太长,服务器无法处理;

  415(Unsupported media type):请求的页面不支持请求的格式;

  416(请求的范围不符合要求):如果页面不能提供请求的范围,服务器会返回这个状态码;

  417(Expectation not met):服务器不满足“expectation”请求头域的要求;

  5XX(服务器错误)

  这些状态代码表明服务器在处理请求时遇到了内部错误。这些错误可能是服务器本身的错误,而不是请求的错误;

  500(Internal Server Error):服务器遇到错误,无法完成请求;

  501(尚未实现):服务器无法满足请求。例如,当请求方法未被识别时,服务器可能会返回此代码;

  502(Bad Gateway):作为网关或代理的服务器收到上游服务器的无效响应;

  503(服务器不可用):服务器当前不可用(由于过载或停机维护)。通常,这只是暂时的状态

  504(网关超时):服务器作为网关或代理,但没有及时收到上游服务器的请求;

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线