如何让搜索引擎收录网站中的内容、排序、展现
优采云 发布时间: 2021-05-18 05:26如何让搜索引擎收录网站中的内容、排序、展现
搜索引擎只是网站上的普通访问者。 网站的爬网方法和网站 /网页的值的判断均基于用户的观点。对用户体验的任何改进,都是对搜索引擎的改进。搜索引擎的优化也将使用户受益。
网站搜索引擎的构建主要分为三个部分:如何更好地使搜索引擎中的内容收录 网站,如何在搜索引擎中获得良好的排名以及如何让用户学习在众多搜索结果中单击网站。简而言之,它是收录,排序和显示。下面我们将分别介绍这三个方面。
好收录
机器可读
百度使用名为Baiduspider的程序对Internet上的网页进行爬网,并在处理后将其构建到索引中。目前,百度蜘蛛只能读取文本内容。诸如Flash和图片之类的非文本内容无法临时处理。放置在Flash中的文字和图片无法被百度识别。
建议使用文本而不是Flash,图像,Javascript等来显示重要内容或链接。搜索引擎无法暂时识别Flash,图像和Javascript中的内容。内容的这一部分无法搜索;仅收录在Flash和Javascript中链接指向的网页,百度可能无法收录。
我们建议:
•使用文本而不是Flash,图片,JavaScript等来显示重要的内容或链接
•如果必须使用Flash制作网页,建议同时为搜索引擎收录制作文本版本,并使用文本链接指向首页上的文本版本
•搜索引擎(如Ajax)无法识别的技术仅在需要用户交互的地方使用,并且您希望搜索引擎“查看”的导航和文本内容不应放在Ajax中
•请勿使用框架和iframe框架结构,通过iframe显示的内容可能会被百度丢弃
在上面的示例中,尽管网页提供了大量信息,但是搜索引擎无法提取信息,因为该信息在闪存中。对于搜索引擎,此网页不收录任何内容。
网站结构
网站应该具有清晰的结构和清晰的导航,这可以帮助用户从网站中快速找到所需内容,还可以帮助搜索引擎快速了解网站中每个页面的位置。层次结构。
网站建议使用树形结构。树结构通常分为以下三个级别:homepage-channel- 文章页面。像一棵大树一样,首先是树干(主页),然后是分支(渠道),最后是叶子(普通内容页面)。树结构更可扩展。当网站的内容更多时,您可以通过细分分支(渠道)来轻松地对其进行处理。
理想的网站结构应该更平坦,从首页到内容页面的层次尽可能少,以便搜索引擎更轻松地进行处理。
同时,网站也应该是网格结构。 网站上的每个页面都应具有指向上层和下层以及相关内容的链接:主页上具有指向频道页面的链接,而频道页面上具有指向主页的链接。指向公共内容页面的链接,公共内容页*敏*感*词*有指向更高级别的频道和主页的链接,与内容相关的网页具有彼此的链接。
网站中的每个网页都应该是网站结构的一部分,并且应该能够链接到其他网页。
总而言之,合理的网站结构应为扁平树状网络结构。我们建议:
•确保至少可以通过一个文本链接访问每个页面。
•重要的内容应该可以从首页访问,也可以在网站结构的相对较浅的级别访问。
•合理地对网站上的内容进行分类,不要过度分类。
网站应该具有简洁明了的导航,以便用户快速找到所需内容,还可以帮助搜索引擎更好地了解网站的结构。我们建议:
•在每个页面上添加一个导航栏,以便用户可以轻松返回频道网站主页,并允许搜索引擎轻松地在网络结构中定位网页的级别。
通过面包屑导航,用户可以清楚地知道自己在整个页面上的位置网站,并且返回上一个频道或首页也非常方便。
•对于网站内容较多的用户,建议使用面包屑导航,这样用户可以更轻松地了解他们当前所在的位置:网站首页>频道>当前浏览的页面
•在导航中使用文本链接,而不是复杂的js或Flash
•在使用图片进行导航时,您可以使用Alt注释,并使用Alt告诉搜索引擎网页所指向的内容
选择子域和目录
选择使用子域或目录合理分发网站内容将对网站在搜索引擎中的效果产生更大的影响。
我们建议:
•在频道内容不够丰富以至无法作为独立站点存在之前,请使用目录形式;等到频道下积累了足够的内容,然后将其转换为子域的形式
无论网页是否可以排名在搜索结果的最前面,“开始”都是非常重要的。如果来自具有较高权重的站点网站,则排名靠前的可能性会更大,反之亦然。通常,主站点的权重最高,子站点将从主站点继承部分权重。继承的数量取决于子站点的质量。
在内容不够丰富以至不能用作独立站点之前,将内容放置在主站点下的目录中可以在搜索引擎中获得更好的性能。
•对于内容差异较大且相关性较低的内容,请使用子网站形式
搜索引擎将识别该站点的主题。如果站点中的内容不高度相关,则可能导致搜索引擎误识别它。无关紧要的内容可以放在不同的子域下,这可以帮助搜索引擎更好地了解网站的主题
•域名的内容应得到适当授权,彼此分开,并且不能通过以下方式访问域名下的内容
子域之间的内容可以彼此访问,并且可以被搜索引擎视为重复内容。保留的URL可能不在普通域名下。
•请勿滥用子域
滥用大量没有丰富内容的子域将被搜索引擎视为作弊行为。
标准的简单网址
创建一个描述性强,标准化且简单的URL可以帮助用户更轻松地记住和判断网页的内容,还可以帮助搜索引擎更有效地抓取您的网站。 网站在设计之初,应该有一个合理的URL计划。
我们建议:
•如果网站中的网页相同,则只有一个网址
如果网站上的多个URL可以访问相同的内容,则存在以下危险:
1、搜索引擎将选择一个网址作为标准网址,该网址可能与真正的网址不同
2、用户可以针对同一网页的不同URL提出建议,并且多种URL形式分散了网页的权重
如果网站上有多个URL表单,建议按以下方式处理它:
1、仅在系统中使用常规URL,并防止用户访问异常URL
2、不会在URL中放置不必要的内容,例如Sessionid和统计代码
3、不同形式的url,301会永久跳转到普通形式
4、用于防止用户输入错误的备用域名,301永久重定向到主域名
5、使用robots.txt禁止Baiduspider捕获您不想显示给用户的表单
•允许用户从URL确定Web内容和网站结构信息,并预测他们将看到的内容
以百度空间为例。用户ID信息已添加到URL结构中。当用户看到该空间的URL时,他们可以轻松确定该空间是谁。还将诸如博客和相册之类的内容信息添加到url结构中,并且用户可以使用url来确定要查看的内容是博客还是相册。
•URL应该尽可能短。长URL不仅难看,而且用户很难从中获得更多有用的信息。另一方面,短网址还有助于减小页面大小,加快网页打开速度并改善用户体验。
该示例中的第一个URL会阻止用户。对于第二个URL,用户可以在贴吧中轻松确定它与百度有关。
•普通动态URL对搜索引擎没有影响。网址是动态网址还是静态网址都不会影响搜索引擎,但是建议您尽量减少动态网址中收录的可变参数,这将有助于缩短网址的长度并降低搜索引擎掉入网址的风险。黑洞
•请勿添加系统无法自动识别为URL一部分的字符
在上面的示例中,字符如“;”和“,”添加到URL。当用户通过论坛,即时消息工具和其他渠道推荐这些URL时,它们将不会自动识别为链接,从而增加了用户对这些网页的访问权限。困难。
•使用百度提供的URL优化工具进行检查
百度网站管理员平台提供了URL优化工具,可以帮助检查URL对搜索引擎的友好程度并提出修改建议。
使用网站站长工具
Internet变得越来越大,越来越复杂。为了更好地处理Internet上的信息,百度为网站管理员提供了一些工具。合理地使用这些网站管理员工具可以节省一半的努力,从而获得两倍的结果。
•百度网站管理员平台:
登录以获取更多帮助信息。
•站点地图:
百度网站管理员平台支持通过站点地图提交网站内容。通过站点地图,百度可以更全面,更快地找到链接,从而使收录更加高效。
•Ping:
Ping是一种提交博客内容的方法,可以实时将博客中的新内容通知搜索引擎。当前主流的博客程序都支持ping,您只需要在博客背景中添加百度的ping服务地址并启用ping功能即可。
•删除无效链接:
百度网站管理员平台支持通过站点地图向百度提交网站无效链接列表。 网站过多的无效链接不仅会影响用户体验,还会影响百度对网站质量的判断。通过死链接删除界面,百度可以更快,更全面地找到网站个死链接,从而有效地删除它们。
注意:提交需要删除的URL后,需要进行以下处理,百度才能将其有效删除:
1、使用robots.txt防止其被抓取;
2、或返回404状态代码以指示当前页面不存在。
•网站站长工具
-URL优化工具检查
百度网站管理员平台提供了URL优化工具,可以帮助检查URL对搜索引擎的友好程度并提出修改建议。
- 网站安全检查
百度网站管理员平台提供了一些工具来检测网站是否被黑客入侵,并提示网站管理员帮助对其进行修改。
♦“ 网站被黑客入侵”是什么?
网站被黑客入侵是指黑客利用网站的过程和设置中的安全漏洞或管理员的安全疏忽(例如低密码复杂性),未经管理员授权进行了网站篡改。
♦如何处理网站被黑客入侵?
1、分析系统日志和服务器日志,以检查站点上的页面数和流量是否存在异常波动,以及访问或操作日志是否存在异常;
2、检查网站文件是否有任何异常修改,尤其是诸如主页之类的关键页面;
3、 网站页是否引用了未知站点的资源(图片,JS等),以及是否放置了来自外部站点的异常链接;
4、检查网站是否存在异常添加的文件或目录;
5、检查网站目录中是否有非管理员打包的网站源代码,未知的txt文件等。
♦如何防止网站被黑客入侵?
1、定期检查服务器日志和其他方法以查找问题,并检查是否存在对非前端页面的可疑访问;
2、始终检查网站文件是否有任何异常修改或添加;
3、重点关注所使用的操作系统和程序的正式网站。及时下载补丁以修复安全漏洞;如有必要,建议直接更新到最新版本;
4、修改开源程序的密钥文件的默认文件名。作弊者通常使用该程序自动扫描某些特定文件的存在,以确定是否使用了某个程序;
5、修改默认的管理员用户名,提高管理后台的密码强度,并使用字母,数字和特殊符号的组合;
6、关闭不必要的服务和端口;
7、关闭或限制不必要的上传功能;
8、设置防火墙和其他安全措施;
9、如果问题反复出现,建议重新安装服务器操作系统并重新上传备份的网站文件;
1 0、如果网站缺少专业的维护人员,建议咨询专业的安全公司;快速发现并处理被黑客入侵的内容,并防止其被黑客入侵,这在很大程度上反映了网站的运营水平。
以上几点仅是初步的。做好网站安全性需要网站管理员和管理员的不懈努力。
•百度搜索框提示功能
百度向网站管理员打开免费的“百度搜索框”代码和“百度搜索框提示”代码。
通过简单的设置,您可以快速将“百度搜索框(具有提示功能)”功能添加到您的网页中。在网站中改善用户的搜索体验。
修改/更改域名
网站在Internet的快速发展中,不可避免地会进行修订和域名更改,但是处理不当可能会导致大量流量丢失。修改和更改域名时需要考虑的第一点是如何确保不会丢失旧用户。当用户访问旧内容时,可以将他们引导到新网站上的相应内容,以避免用户无法访问以前喜欢的网页的情况。
我们建议在修改或更改域名时,将旧网页301永久重定向到与该内容相对应的新网页,以便百度可以更轻松地检测到此更改并将旧网页所累积的权重迅速转移到相应的新网页。
其他建议:
•如果不需要,请勿完全替换整个网站内容
修改网站或更改网站中重要页面的链接时,应将修订前的页面301永久重定向到修订后的相应页面
•网站要更改域名,应将旧域名的所有页面永久重定向301到新域名上的相应页面
网站更改域名后,请保持旧域名能够尽可能稳定地访问,从而使用户有更多时间记住新域名
•网站更改版本/域名后,请通过站点地图将新域名下的新URL / URL提交给百度,以帮助百度更快地找到并进行调整。
合理的返回码
百度抓取工具在抓取和处理时,会根据http协议规范设置相应的逻辑,因此网站站长还应参考http协议中返回代码含义的定义来进行设置。
百度蜘蛛对常用的http返回码的处理逻辑如下:
•404
404返回码的含义是“ NOTFOUND”。百度会认为该网页无效,因此通常会将其从搜索结果中删除,并且蜘蛛程序会在短期内再次找到该网址,并且不会对其进行爬网。
•503
503返回码的含义是“ ServiceUnavailable”。百度会认为该网页暂时无法访问,通常网站暂时关闭,带宽有限等都会导致这种情况。对于返回503的网页,百度蜘蛛不会直接删除此URL,而是会在短期内再次访问。届时,如果网页已还原,则将正常爬网;如果继续返回到503,它将在短时间内访问几次。但是,如果网页长时间返回503,则该网址仍会被百度视为断开的链接,并会从搜索结果中删除。
•403
403返回码的含义是“禁止访问”,百度会认为当前禁止访问该网页。在这种情况下,如果它是新发现的URL,则百度蜘蛛不会暂时对其进行爬网,并会在短期内再次对其进行检查;如果它是百度已经找到的收录网址,则目前不会直接删除,并且会在短期内再次访问。届时,如果允许访问该网页,它将被正常爬网;如果仍然不允许,它将在短时间内访问几次。但是,如果该网页长时间返回403,百度也会将其视为无效链接,并将其从搜索结果中删除。
•301
301返回码的含义是“ MovedPermanently”,百度会认为该网页当前已重定向到新的url。在站点迁移,域名替换或站点修订的情况下,建议使用301返回码,以最大程度减少由修订引起的流量损失。尽管百度蜘蛛现在对301次跳跃的响应周期更长,但我们仍然建议您这样做。
我们建议:
•如果站点暂时关闭,则在无法打开网页时,请不要立即返回404。建议使用503状态。 503可以通知百度蜘蛛该页面暂时不可用,请稍后再试。
•如果百度蜘蛛对您的网站施加太大的压力以进行爬网,请尝试不要使用404,并且建议您返回503。这样,百度蜘蛛会在一段时间后尝试再次爬网此链接。如果该站点当时免费,则将成功对其进行爬网。
•有些网站希望百度仅收录部分内容,例如经过审查的内容,一段时间内积累的新用户页面,等等。在这种情况下,建议暂时将新发布的内容返回到403,然后在查看或处理后返回到正常状态返回码。
•对于网站迁移或域名更改,请使用301返回。
排序很好
涵盖网页主要内容的标题
网页标题用于告诉用户和搜索引擎该网页的主要内容是什么。当搜索引擎判断网页内容的权重时,标题是主要参考信息之一。网页标题是网页上主要内容的摘要。搜索引擎可以通过网页标题快速确定网页主题。每个网页的内容都不同,并且每个网页都应具有唯一的标题。
我们建议页面标题可以这样描述:
•主页:网站名称或网站名称_提供服务介绍或产品介绍
•频道页面:频道名称_ 网站名称
•文章页面:文章 title_channel名称_ 网站 title
title是指html文档中的标签,而不是文章的标题,该标题以以下形式放置在html文档中
推荐做法
•每个网页都应具有唯一的标题,不要对所有页面都使用默认标题
•标题应主题明确,并收录此页面最重要的内容
•简洁明了,没有列出与网页内容无关的信息
•用户通常从左到右浏览,重要的内容应放在标题的顶部
•以用户熟悉的语言进行描述。如果您有两个网站中英文名称,请尝试使用用户熟悉的名称作为标题说明
良好的内容建设
•网站内容的构建侧重于服务网站的核心价值,提供给搜索引擎收录的内容也应该是有助于其核心价值的内容。内容构造必须符合网站的主题。例如,如果您的网站是it新闻网站,请不要放很多漂亮的女人的照片。除了浪费服务器资源之外,网站的核心价值也没有。帮助,看过精美图片的人不会对此新闻感兴趣。
某些sns 网站注册用户是其最重要的资源,也是吸引新注册用户的主要依赖。搜索引擎中的名称搜索是潜在的新用户的重要来源,它们将其提供给搜索引擎收录。注册用户名资源可以指导搜索引擎用户转换为其注册用户。
•网站的内容应面向用户,搜索引擎只是网站的普通访问者,提供满足用户需求的原创内容很重要
•精心撰写锚文本
锚文本是指进行链接时使用的描述文本。它用于告诉用户链接所链接的网页的主题。锚文本的描述越清晰,用户越容易理解网页的内容。
用户通过其他网页的链接与您的网页联系。用户是否可以理解此链接的描述对于吸引用户访问至关重要。与普通用户一样,当搜索引擎找到一个新网页时,锚文本也是该网页描述的唯一参考因素。
•在图片中添加替代说明
当互联网速度很慢时,无法显示图片以使用户理解图片传达的信息,也可以使搜索引擎了解图片的内容。
•资源丰富的内容可以以诸如主题之类的内容组织形式提供给用户,从而使用户能够以最低的成本获得他们所需的所有信息。
•Web 2. 0类型网站应充分利用自身的优势,允许用户通过投票,评论和其他方式自行判断资源的质量。这些质量判断也可以由搜索引擎使用。判断资源的价值。
从某个电视台进行投票时,视频质量通常很高,用户可以参考投票信息以减少放映费用
•管理网络2. 0和其他用户生成的内容产品。如果作弊者使用它们,则可能会影响整个站点的重量。
赢得网站的用户推荐
有许多网站在Internet上提供相同的内容和服务。当内容相同时,哪个网站会排名在搜索引擎之前?决定性因素是推荐。我们经常谈论的超链接是推荐的超链接。
当网站上的内容对用户有用时,用户会将其推荐给其他人。推荐的形式可能有所不同:使用即时消息工具发送给您的朋友,并在您经常使用的论坛上重新发布推荐。 ,为博客写一个非常庄重的介绍,为我的网站上的友情链接提供建议,等等。搜索引擎将使用这些推荐的信息来确定page / 网站的值。适当的鼓励和引导用户推荐您的网站,将大大帮助网站在搜索引擎中的表现。
某些视频网站的共享和重新发布功能可以使用户更方便地复制视频并与其他用户共享,这大大降低了用户推荐网站内容的成本,并且用户数量更多。愿意推荐。
好的演讲
吸引眼球的标题
当用户在百度网络搜索中搜索您的网页时,标题将显示为摘要中最重要的内容。具有清晰主题的标题可以帮助用户更轻松地判断您网页上的内容是否来自搜索结果。满足他的需求。
推荐做法:
•标题应主题明确,并收录此页面最重要的内容
•在文章页面的标题中不要添加过多的额外说明,这会分散用户的注意力
•以用户熟悉的语言进行描述
•如果您对网站用户更加熟悉,建议在标题的适当位置列出网站名称,品牌效应会增加用户点击的机会
•标题应该对用户有吸引力
•使用户具有信任感
示例中的网页在全国主要城市提供天气预报服务。在第一个结果中,使用了百度地图的默认标题。用户无法在搜索结果中判断此网站所提供的内容,因此无法点击此结果。在第二个结果中,标题清楚地说明了所提供的内容。用户易于判断,选择此结果的可能性相对较高。
充分利用元描述
Metadescription是Web内容的简要摘要。如果描述与网页内容匹配,则百度会将其视为摘要的选择目标之一。良好的描述将帮助用户更轻松地从搜索结果中判断您的网页内容是否满足他们的需求。元描述不是重量计算的参考因素。是否存在此标签不会影响网页的权重,只会用作搜索结果摘要的选择目标。
Metadescription是meta标记的一部分,位于html代码区域
推荐做法:
•网站主页,频道页面,产品参数页面以及其他没有大文本作为摘要的页面最适合描述
•准确地描述页面,不要堆积关键词
•为每个网页创建不同的描述,以避免所有网页使用相同的描述
•长度合理,但长度不要太短
在该示例中,第一个不应用元描述,第二个应用元描述。可以看出,第一个结果的摘要基本上对用户没有参考价值,第二个结果的摘要更具可读性,可以使用户更好地了解网站的内容。