爬取数据搜索引擎眼中页面的基本依据(一)

优采云 发布时间: 2021-06-15 21:28

  爬取数据搜索引擎眼中页面的基本依据(一)

  一、爬取数据

  搜索引擎通过网页之间的链接抓取互联网内容。爬行的起点理论上可以在任何地方,但理想的情况是从某个可信的网站开始。

  二、排名的基本依据(一)relativity

  是网页内容与用户搜索内容的相关程度。一般来说,在以下情况下相关性会增加:

  查询的内容在文本、文档标题或重要副标题中多次出现,并且页面有来自使用相关锚文件和使用相关锚文本的相关页面的链接。

  (二)重要性程度

  与用户查询匹配的文件的重要性或受欢迎程度。一般是指其他文件引用修改后的文件的次数。

  三、搜索引擎眼睛页面(一)可以看到内容

  (1)page title(title标签)。网页的标题栏和每个搜索结果顶部的蓝色链接就是它的内容。它是影响排名的最重要因素之一。

  (2)标签。很多年前作弊者破坏了这个标签的价值,所以现在这个关键词标签对于谷歌来说几乎可以忽略不计,但雅虎和必应似乎将其作为参考。(亲测,百度有效)

  (3)标签。搜索引擎经常将其作为搜索结果的页面描述,对点击率有显着影响。

  (4)图片的alt属性,有视力障碍或关闭图片显示的人需要使用。

  (二)unseen content

  (1)图片、音频、视频。

  (2)flash(部分)。

  (3)frame, iname

  (4)embed

  (5)ajax 动态加载内容

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线