利用百度提供URL优化工具检查URL对搜索引擎的友好程度

优采云 发布时间: 2021-06-08 23:11

  利用百度提供URL优化工具检查URL对搜索引擎的友好程度

  一个网址会让用户望而却步。对于第二个网址,用户很容易判断是贴吧中的百度。

  • 普通动态网址对搜索引擎没有影响

  url是动态的还是静态的对搜索引擎没有影响,但建议尽量减少动态url中收录的可变参数,这样有利于减少url的长度,降低搜索引擎的风险掉进黑洞

  

  • 不要添加系统无法自动识别为 url 一部分的字符

  在上面的例子中,诸如“;”之类的字符和“,”被添加到网址中。当用户通过论坛、即时通讯工具等渠道推荐这些网址时,它们不能被自动识别为链接,从而增加了用户对这些网页的访问。难度。

  • 使用百度提供的网址优化工具查看

  百度站长平台提供了网址优化工具,可以帮助检查网址对搜索引擎的友好度,并提出修改建议。

  PS:这部分详细介绍了URL设置方法。 URL优化也是搜索引擎优化的重要组成部分。关于url优化,《百度搜索引擎优化指南2.0》从固定链接、url描述、url长度、url特殊字符等方面给出建议。固定链接可以方便搜索引擎的有效记录,增加网站的权重;带有描述功能的网址可以收录关键词,关键词的组合可以形成一个新的关键词,比如***.com/seo/,搜索引擎蜘蛛和用户都可以理解这个页面是关于肖玉强的seo研究; URL 长度应尽可能短,以减少搜索引擎蜘蛛的抓取成本。上图中的例子很清楚,有很长的URL列表。绝对不如短网址好;最后,收录特殊字符的 URL 不能自动识别为链接。在进行网址推广时,用户访问这些网页的难度更大。

  5、使用站长工具

  互联网变得越来越大,越来越复杂。为了更好的处理互联网上的信息,百度为站长提供了一些工具。合理使用这些站长工具,事半功倍。

  • 百度站长平台:

  登录以获取更多帮助信息。

  • 站点地图:

  百度站长平台支持通过站点地图提交网站内容。通过站点地图,百度可以更全面、更快捷地找到链接,让收录更有效率。

  • 平:

  Ping 是一种提交博客内容的方式,实时通知搜索引擎博客上的新内容。目前主流的博客程序都支持ping,您只需要在博客后台添加百度的ping服务地址并开启ping功能即可。

  • 死链接删除:

  百度站长平台支持通过站点地图向百度提交网站死链接列表。 网站死链接太多,不仅影响用户体验,也影响百度对网站质量的判断。通过死链删除界面,百度可以更快更全面地找到网站死链,从而有效删除。

  注意:提交需要删除的网址后,需要进行如下处理,百度才能有效删除:

  1、使用robots.txt防止被抓取;

  返回2、或404状态码,表示当前页面不存在。

  • 网址优化工具检查

  百度站长平台提供了网址优化工具,可以帮助检查网址对搜索引擎的友好度,并提出修改建议。

  • 网站安全检测

  百度站长平台提供工具检测网站是否被黑,并提示站长帮助修改。

  什么是“网站被黑”?

  网站被黑是指黑客利用网站的程序、设置等安全漏洞或管理员的安全疏忽(如密码复杂度低),未经管理员授权,对@进行攻击k14@篡改。

  网站被黑怎么处理?

  -分析系统日志和服务器日志,检查您网站的页面数、流量等是否有异常波动,是否有异常访问或操作日志;

  -检查网站文件是否被异常修改,尤其是首页等关键页面;

  -网站页面是否引用了未知站点的资源(图片、JS等),是否放置了来自外部站点的异常链接;

  -检查网站是否有异常添加文件或目录;

  -检查网站目录下是否有非管理员打包的网站源代码、未知txt文件等。

  感谢济南seo肖玉强的贡献

  前几天,肖玉强解读了《百度搜索引擎优化指南2.0》第一部分:SEO准备。在这一部分,我们重点分析了域名。设置和空间(服务器)选择。今天继续阅读《百度搜索引擎优化指南2.0》第二部分:网站搜索引擎建设。这部分内容从“好收录”、“好排名”、“好呈现”三个方面来阐述。因为这部分内容比较多,今天我们就来看第一小部分“good收录”。我声明一下:如果你认为自己是seo高手,请不要看下面的内容。写给久未入行的朋友。

  网站 搜索引擎构建

  搜索引擎只是网站上的普通访问者。 网站的爬取方式和对网站/网页价值的判断也是基于用户的角度。对用户体验的任何改进,都是对搜索引擎的改进。搜索引擎的优化也会让用户受益。

  网站搜索引擎的构建主要分为三个部分:如何更好的让内容在搜索引擎收录网站中,如何在搜索引擎中获得好的排名,以及如何让用户学习 在众多搜索结果中单击您的网站。简单的说就是收录、排序、展示。下面我们将分别介绍这三个方面。

  PS:其实收录——排序——显示也是搜索引擎的工作顺序,即网站内容必须先由搜索引擎收录添加到网络资源库中,然后搜索引擎对页面进行分析并对网页进行排序,最后当用户查询到对应的关键词时,搜索引擎就会将网页的内容展示给用户。

  网站搜索引擎构建-good收录

  1、机器可读

  百度使用一个叫Baiduspider的程序抓取互联网上的网页,处理后建立索引。目前百度蜘蛛只能读取文本内容。 Flash、图片等非文本内容暂时无法处理。百度无法识别flash中的文字和图片。

  推荐使用文字代替flash、图片、Javascript等来展示重要的内容或链接。搜索引擎暂时无法识别 Flash、图片和 Javascript 中的内容。这部分内容无法搜索;只收录在flash和Javascript链接指向的网页,百度可能无法收录。

  我们推荐

  • 使用文本代替 flash、图片、Javascript 等来显示重要内容或链接

  • 如果一定要使用Flash制作网页,建议您也为搜索引擎收录制作文字版,并使用文字链接指向主页上的文字版

  • Ajax 和其他搜索引擎无法识别的技术仅在需要用户交互的地方使用,您希望搜索引擎“看到”的导航和文本内容不应放在 Ajax 中

  • 不要使用frame和iframe框架结构,通过iframe展示的内容可能会被百度丢弃

  

  在上面的例子中,虽然网页提供了丰富的信息,但搜索引擎无法提取信息,因为信息在flash中。对于搜索引擎,此网页不收录任何内容。

  PS:请记住,以目前的搜索引擎技术,它只能识别文本内容。

  漂亮的图片无法被华丽的 Flash 搜索引擎识别。因此,建议为图片添加alt描述。如果使用flash,必须做SWFObject等SEO优化。

  强大的js特效要适当使用,否则会适得其反。避免使用 JS 进行导航和其他链接; 关键词相关内容少用JS;。将JS分离成单独的JS文件并调用。尽量放在不重要的地方,比如页面底部。对于不识别Ajax技术的搜索引擎,很容易解释,搜索引擎蜘蛛索引页面,而不是索引程序。

  搜索引擎不喜欢框架和 iframe。使用 iframe 将一个页面分成多个页面会大大降低搜索引擎的友好度。 iframes 的内容不会收录,无法在搜索引擎中显示,尤其是引用外部内容对排名有负面影响。

  2、网站结构

  网站 应该有清晰的结构和清晰的导航。这可以帮助用户快速从你的网站中找到他们需要的东西,也可以帮助搜索引擎快速了解网站中每个网页的位置。结构层次。

  网站Structure 建议采用树状结构,通常分为以下三个层次:首页——频道——文章页。就像一棵大树,先是树干(首页),然后是树枝(频道),最后是叶子(普通内容页面)。树形结构更具可扩展性。当网站的内容变多时,可以通过细分分支(频道)轻松处理。

  理想的网站结构应该是扁平化的,从首页到内容页的层次越少越好,这样搜索引擎会更容易处理。

  同时网站也应该是网状结构。 网站上的每个网页都应该有上下级网页和相关内容的链接:首页有频道页链接,频道页有首页链接。公共内容页面的链接,公共内容页面有上级频道和首页的链接,内容相关网页之间有链接。

  网站 中的每个网页都应该是网站 结构的一部分,并且应该通过其他网页链接到。

  综上所述,合理的网站结构应该是扁平的树状网络结构。

  我们推荐

  • 确保每个页面都可以通过至少一个文本链接访问。

  • 重要内容应可从主页或网站 结构中相对较浅的级别访问。

  • 合理分类网站上的内容,不要过度分类。

  网站应该有简洁明了的导航,让用户快速找到自己需要的东西,也有助于搜索引擎更好地理解网站的结构。

  我们推荐

  • 为每个页面添加导航栏,方便用户返回频道,网站导向搜索引擎网站构建首页,也让搜索引擎轻松定位网页中的层级网页结构。

  

  • 通过面包屑导航,用户可以清楚地知道自己页面在整个网站中的位置,并且可以轻松返回上一个频道或首页。

  • 对于内容较多的网站,建议使用面包屑导航,方便用户了解当前所在位置:网站Home》频道》当前浏览页面

  &b

  3、子域和目录选择

  选择使用子域或目录来合理分发网站内容会对网站在搜索引擎中的表现产生更大的影响。

  我们推荐

  在一个频道的内容不够丰富作为一个独立站点存在之前,使用目录格式;等到频道下积累了足够的内容,再转换成子域的形式。

  一个网页能否排在搜索结果的前面,“开始”很重要。如果来自网站权重较高的网站,则更有可能排名第一,反之亦然。通常情况下,主站点的权重最高,子站点会继承主站点的部分权重。继承的数量取决于子站点的质量。

  在内容不够丰富作为独立站点使用之前,将内容放在主站点下的一个目录中可以在搜索引擎中获得更好的性能。

  • 对内容差异较大且相关性较低的内容使用子站点。

  搜索引擎会识别网站的主题。如果站点中的内容相关性不高,可能会导致搜索引擎对其进行错误识别。相关性不高的内容可以放在不同的子域下,帮助搜索引擎更好地理解网站主题。

  • 域名之间的内容是经过授权的,相互分离。下的内容。不能通过b访问。

  子域之间的内容可以相互访问,并且可能被搜索引擎视为重复内容。保留网址可能不在普通域名下。

  • 不要滥用子域

  滥用大量内容不丰富的子域会被搜索引擎视为作弊。

  PS:这部分讲的是子域和目录的使用。子域或目录的权重是否更高?这取决于实际情况。子域被认为是一个独立的站点,目录被认为是主站点的一部分,所以当内容不够丰富时,建议将内容放在目录下。当内容差异较大时,以子域的形式表达更有利于搜索引擎识别。之间的好权限。和 b.这里所说的意思是两个独立的子域之间的内容应该是独立的,不要互相访问,否则会被认为是重复的内容。这里还要提到一个影响网页排名的因素,即网页的来源。如果来自网站权重较高的网站,则更有可能获得第一名。

  4、Standard,简单的url

  创建一个描述性好的、标准化的、简单的网址,可以帮助用户更容易地记住和判断网页的内容,也有助于搜索引擎更有效地捕捉你的网站。 网站设计之初,要有合理的URL规划。

  我们推荐

  •网站中的同一个网页只对应一个网址。如果网站上的多个网址可以访问同一个内容,就会出现如下危险:

  1. 搜索引擎会选择一个url作为标准,可能和真实的不一样

  2. 用户可以对同一网页的不同网址进行推荐,多种网址形式分散了网页的权重。

  如果你的网站上已经有多个URL表单,建议按照下面的方法

  处理:

  1.系统中只使用正常的URL,用户不会接触到异常的URL

  2.不要在url中放入session id、统计代码等不必要的内容

  3.不同形式的url,301会永久跳转到正常形式

  4.备用域名用于防止用户输入错误域名,301永久重定向到主域名

  5. 使用robots.txt禁止百度蜘蛛抓取你不想展示给用户的表单

  • 允许用户从 URL 中确定网页内容和网站 结构信息,并预测他们会看到什么

  

  以百度空间为例。用户 ID 信息被添加到 URL 结构中。当用户看到空间的 URL 时,他们可以很容易地确定它是谁的空间。 url结构中还加入了博客、相册等内容信息,用户可以通过url来判断要查看的内容是博客还是相册。

  • URL 应尽可能短

  长网址不仅难看,而且用户也很难从中获取额外的有用信息。另一方面,短网址也有助于缩小页面大小、加快网页打开速度并改善用户体验。

  

  示例中的第一个

  ”代码。

  通过简单的设置,您可以快速为您的网页添加“百度搜索框(带提示功能)”功能。改善网站 中的用户搜索体验。

  PS:这部分百度重点推荐自己的站长平台。在百度站长平台,您可以: 了解您的网站在百度抢和收录中的状态;使用百度站长工具优化你的网站;与百度近距离交流。使用“站点地图”和“ping”向搜索引擎提交网站信息;通过百度站长平台,还可以删除死链接、优化url、检查网站安全、防止网站被黑。百度推出的站长平台目前正在内测,申请需要邀请码。这个邀请码似乎很难获得。肖玉强一直在使用的站长工具,非常好用。入口地址:.观望百度站长平台。

  6、改版/更改域名

  网站Revision 和域名更改在互联网的高速发展下是不可避免的,但处理不当会造成重大的流量损失。

  改版和改域名需要考虑的第一点就是如何保证老用户不流失。当用户访问旧内容时,可以引导到新网站上的相应内容,防止用户无法访问以前的采集夹。网页的情况。

  我们建议在修改或更改域名时,将旧网页301永久重定向到内容对应的新网页,以便百度更容易检测到这种变化,并快速将旧网页累积的权重转移到相应的新网页。 .

  我们推荐

  • 如非必要,请勿完全替换整个网站内容

  网站改版或网站重要页面的链接发生变化时,修改前的301页面要永久重定向到修改后的对应页面。

  •网站更改域名时,旧域名的所有页面都要301永久重定向到新域名对应的页面

  网站 更改域名后,尽量保持旧域名能够稳定访问,让用户有更多时间记住新域名

  •网站改版/更改域名后,请通过站点地图将新域名下的新网址/网址提交给百度,以帮助百度更快地查找和调整。

  PS:这部分介绍了网站改版以及更改域名的注意事项。首先网站不要轻易进行*敏*感*词*改版,因为改版难免会给网站栏目频道带来变化,导致原来的页面地址失效,导致修改时出现404错误提示用户原来放置在采集夹文件夹中的页面再次打开。其次,修改后的原页面应该是301重定向的。说白了,所谓重定向就是通过各种方式将各种网络请求重定向到其他位置。也就是说,重定向后,用户原本是放在采集夹里的。 网站改版后可以打开文件夹中的网页,方便用户,减少流量损失。网上301重定向的方法很多,大家可以自行查看。

  建议在域名变更前后,最好在网页显着位置提醒用户网站域名变更,让用户有时间接受并记住新域名。

  将修改后的网站和新域名提交给搜索引擎,有助于搜索引擎更快的发现网站的变化并进行调整。百度的网站登录入口是

  7、reasonable 返回码

  百度爬虫在抓取和处理时,会根据http协议规范设置相应的逻辑,所以站长也应该参考http协议中返回码含义的定义进行设置。

  百度蜘蛛对常用http返回码的处理逻辑如下:

  • 404

  404 返回码的含义是“NOT FOUND”。百度会认为该网页无效,因此通常会从搜索结果中删除,蜘蛛会在短期内再次找到该网址,不会抓取。

  • 503

  503 返回码的含义是“服务不可用”。百度会认为网页暂时无法访问,通常网站暂时关闭,带宽受限等都会造成这种情况。对于返回503的网页,百度蜘蛛不会直接删除该网址,短期内还会再次访问。届时,如果网页已经恢复,就可以正常抓取;如果继续返回503,那么短时间内会被多次访问。但是如果网页长时间返回503,那么这个网址还是会被百度认为是失效链接,会从搜索结果中删除。

  • 403

  403返回码的意思是“禁止访问”,百度会认为该网页当前被禁止访问。在这种情况下,如果是新发现的网址,百度蜘蛛暂时不会抓取,会在短期内再次检查;如果是百度有收录url,目前不会直接删除,短期内会再次访问。那个时候,如果网页被允许访问,就会正常抓取;如果仍然不允许,将在短时间内访问多次。但如果网页长时间返回403,百度也会认为是无效链接,从搜索结果中删除。

  • 301

  301返回码的意思是“Moved Permanently”,百度会认为网页当前重定向到了新的url。在网站迁移、域名更换或网站改版的情况下,建议使用301返回码,以尽量减少改版带来的流量损失。虽然百度蜘蛛现在对 301 跳转的响应周期更长,但我们仍然建议您这样做。

  我们推荐

  • 如果网站暂时关闭,无法打开网页时,请不要立即返回404。建议使用 503 状态。 503可以通知百度蜘蛛页面暂时不可用,请稍后再试。

  • 如果百度蜘蛛对您的网站抓取压力过大,请尽量不要使用404,也建议返回503。这样,百度蜘蛛过一段时间会再次尝试抓取该链接。如果那个时候网站是免费的,它就会被成功抓取。

  • 有一些网站希望百度只会收录部分内容,比如审核后的内容,一段时间积累的新用户页面等等。在这种情况下,建议对新发布的内容暂时返回403,待审核或做好处理后再返回正常返回码。

  • 网站搬迁或域名变更时,请使用301返回码。

  PS:这部分《百度搜索引擎优化指南2.0》解释了各种返回码的概念和含义,以及在什么情况下使用什么样的返回码。通过合理设置各种返回码,百度搜索引擎蜘蛛可以更好地了解网站信息,包括但不限于网页失败、暂时无法访问、网页域名更改后重定向等。至于如何设置各种返回码,网上资料很多,可以自己查一下,自己实现。

  今日总结:今天济南徐晓宇强针对搜索引擎网站建设,分析了《百度搜索引擎优化指南2.0》中的“good收录”部分。一个好的收录 是网页排名和呈现给用户的基础。本文从提高机器可读性、优化网站结构、合理使用子域和目录的选择、规范简单URL、使用站长工具优化网站、修改/更改域名时的注意事项入手,以及设置合理的返回码分七个方面进行说明。通过这些优化设置,提高了搜索引擎的友好度,让搜索引擎蜘蛛抓取到更多的页面信息,为接下来的页面排序和用户查询展示铺平道路。

  未完待续,敬请期待...

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线