网站搜索引擎优化方法(如何解决新网站的百度收录问题?的进化)
优采云 发布时间: 2021-11-29 12:02网站搜索引擎优化方法(如何解决新网站的百度收录问题?的进化)
很多站长都会遇到这个问题。网站开发完成并上线后,百度就没有了收录。即使收录只是一个收录首页,内页也很难快速收录。如何解决这个问题呢?搜索引擎的发展是在互联网的早期。网站 的数量有限,因此手动排序是可行的。比如有一个手动编辑的网站数据库,比如DMOZ,它把不同类别的各种URL进行整理。
后来网站的数量在全世界爆炸,人工排序不现实,于是有了网络爬虫(也叫蜘蛛)代替人工访问爬取网站,这是最原创的搜索引擎。互联网虽然是网状结构,但仍然很难捕捉到整个互联网上的所有网站。首先要解决的问题是如何找到这些网站。
为了解决这个问题,搜索引擎会有一个基本的网站数据库,从网站这里开始,希望能够抓取整个互联网信息。此外,还可以根据链接和使用的链接文本之间的引用关系计算网页的权重,从而对搜索结果进行排序。比如谷歌的PageRank算法。
雅虎是一个非常早期的搜索引擎。它以DMOZ的网站作为抓取爬虫的起点,并怀疑Google也使用了DMOZ的数据,因为10多年前我们做网站的时候,大家都希望自己的网站可以成为 DMOZ收录 甚至贿赂 DMOZ 的编辑。
当时大家都在拼命交换友情链接,PR值高的网站就是大叔。这对应于网站的收录速度和排名。
一个新的网站,如果有高PR值网站给你加个友情链接,很快就可以抓到网站收录。在早期,互联网内容稀缺。做个网站,找个有实力的网站来交换友情链接。这些搜索引擎爬虫急于抢收录。但是现在互联网上的内容太多了(谷歌的总索引页数约为477亿),搜索引擎也越来越挑剔,所以新网站越来越难获得流量。
那么如何解决新的网站百度收录问题呢?
用新注册的域名做网站,从被百度收录到上榜需要很长时间。
就像你遇到陌生人一样,你根本不知道他的细节,评价和观察的时间会很长。
所以希望网站快点收录。建议花钱买个老域名,最好选择注册历史悠久、无不良记录、各大搜索引擎、残留索引记录的域名。
什么是“无不良记录”?
该域名未涉及*敏*感*词*、*敏*感*词*、*敏*感*词*、医疗等非法或灰色行业。
再点几张页面快照,看看年初的月份,再看看最近的快照。还有一点就是在查看快照的时候,右键查看页面的源码,看看底部的友情链接部分有没有非法的网站,避免选择被黑的网站@ >.
而如果一个域名超过一年没有做,你可能不得不放弃。购买旧域名可以到聚铭网或其他提供旧域名抢注或交易的网站。均价在100-200之间。
百度权重、各搜索引擎的收录状态等基本域名数据,可通过爱站SEO助手或自行编写程序获取。以上技巧很实用,前段时间跟朋友学的。
投掷和保持
如果百度不收录,那我们就要主动投票。百度站长平台提供了四种提交抓取请求的方式。
1、主动推送:最快的提交方式。
适用场景:通过这种方式将新生成的链接网站推送给百度,保证百度收录能够及时收到新链接。
在站长平台后台,点击“网页抓取”->“链接提交”查看具体说明。百度提供了curl、php、ruby等示例代码。
2、自动推送:最便捷的提交方式。
使用方法:将自动推送的JS代码添加到网站的每一页。当用户访问该页面时,页面链接会自动推送到百度。可与主动推送一起使用。
3、站点地图:传统提交方式。
许多网站cms提供了生成Sitemap的功能。如果没有,则需要使用工具或编写代码自己生成。使用 Sitemap 告诉百度蜘蛛要抓取哪些网页。
百度站点地图支持3种格式:txt文本格式、xml格式、站点地图索引格式。
如果是小网站,页数小于50000,可以使用txt或xml格式的sitemap文件,放在网站的根目录下。
如果网页数量超过50000个,可以将URL拆分成一组50000个xml文件,然后放入Sitemap索引文件中,通过站长平台提交给百度。
具体格式请参考百度官方说明:站点地图提交工具站长信息百度站长平台
站点地图提交方式收录比主动推送慢。
4、手动提交:最懒的后台提交方式。
通过百度站长后台手动提交,一次只能提交20个网址。
但是原创有提交入口,原创的内容可以在这里提交。
有几个问题需要注意:
主动提交 Sitemap 将有助于百度识别和抓取您的内容,但不一定 收录 所有 URL。只有高质量的页面才会收录。
重复提交是没有用的,反而会浪费主动推送配额。
有一种特殊的手机站点地图格式,需要按照百度要求的格式制作并提交。
虽然搜索引擎越来越先进,但爬虫(蜘蛛)的基本原理并没有太大变化。
如果你想让一个页面成为收录,你需要一个蜘蛛来访问正在爬取的页面。如果没有蜘蛛光顾它,就没有办法说成为网站成为收录。
因此,积极的推广和链接交换仍然是加速收录的有效手段。
如果你有一个经常被百度爬取的网站,在首页添加新站点的链接文字,引导蜘蛛抓取你的新站点。有些人会使用一些黑帽技术,比如蜘蛛池,利用爬取漏洞将百度蜘蛛困在资源站,最后将外部链接导出到新站,以加速收录。
这篇文章的链接: