百度网站抓取之seo网页质量和内容大小常见问题解答

优采云 发布时间: 2022-05-06 20:13

  百度网站抓取之seo网页质量和内容大小常见问题解答

  百度网站抓取之seo网页质量和内容大小常见问题解答:

  

  问:我们的页面本身就很大,会不会解析不出来?

  答:页面本身很大倒没问题,赶集、安居客这些量都很大,没有问题。我刚才说的例子,你每次都follow出来新链接,随机把后面的参数去掉都不影响这个网页的正常访问,这种肯定有问题的。

  问:刚才说对URL的长度有要求,那对每一段、就是目录名的长度有没有要求

  答:没有要求,我们是要求url从www开始到结束,总长度不超过1024个字节。

  问:站内重复内容是怎么判断的?文本内容一样结构不一样,算不算重复?

  答:算重复

  问:假设是整个页面全是Flash,如果我把一些栏目或者最新的内容隐藏掉,不影响美观隐藏掉,如果用hidden属性能不能提取出来?CSS可不可以?

  答:hidden可以提出来,但如果是注释就不会管。CSS不可以。

  问:页面大小不超过1兆,是指页面压缩以前还是以后。

  答:指页面压缩以后,不要超过1兆

  问:我网站的信息已经过时了,但网页返回的是200,会受惩罚?为什么呀?

  答:用户在搜索结果里点了你的结果,导流导到你的网站,但没什么可看的,对用户没有用,百度当然不喜欢。

  问:现在我们很多网站,为了让用户觉得有意思,内容没了就放一张图片,写一些有意思的话,什么“工程师去哪啦”之类的,对百度友好不?

  答:最好不要用,我知道站点是想让百度当内容死链来识别,但内容死链识别起来是有准确率和召回率风险的。

  问:我们团购网站的确会有过期团购的页面,会受惩罚吗

  答:如果量特别大、点击量很大的话肯定会有惩罚的。有些可以当内容死链被分析出来,如果分析不出来,会被一些其他的策略挖出来,会有这样的问题。

  问:刚才说资讯内容页面,上面有个发布时间好,那如果页面上没有时间呢?

  答:那我们往往是按当时抓取的时间来做判定。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线