网站改版 内容排序(需求特征词库的类别的建立与更新众所周知的分类词条)

优采云 发布时间: 2022-03-29 22:06

  网站改版 内容排序(需求特征词库的类别的建立与更新众所周知的分类词条)

  一、特征词典类别的建立与更新

  众所周知,百度有一个特征词库,通过它可以判断用户的查询顺序。例如:当用户搜索“在线看天龙八部”、“在线看射雕*敏*感*词*”、“在线看鹿鼎记”、“在线看电视剧”时,由于“龙八部”,这些待挖掘序列中的《射雕*敏*感*词*》《射雕*敏*感*词*》《鹿鼎记》《电视剧》属于需求特征词库中视频需求的特征词,出现频率“在线观看”关键词与上述视频需求的特征词共现 当达到某个阈值(共现阈值)时,根据关键词“

  二、条目分类

  首先对查询序列进行切分得到切分的词条,然后根据词条通过词条语义分析或需求特征词库中的匹配查询等手段得到候选需求类别。例如:当用户的查询序列是“土豆上的热门影视剧”时,进行分词处理得到“土豆/热门/影视剧”,因为影视剧这个词有明显的需求类别,比如视频、下载、图片、演员介绍,然后根据词条通过词条语义分析或需求特征词库中的匹配查询等方式获取候选需求类别。

  图像搜索结果对应的累计用户点击次数为700次。当预设点击阈值为10000次时,对待挖掘序列对应的分类结果进行分类。将用户的累计点击次数与预设的点击阈值进行比较,根据高于预设点击阈值的分类结果对应的需求类别,即新闻需求类别,挖掘待挖掘序列之间的描述提取新闻需求类别。建立映射关系,根据映射关系建立或更新需求特征词汇。将用户的累计点击次数与预设的点击阈值进行比较,根据高于预设点击阈值的分类结果对应的需求类别,即新闻需求类别,挖掘待挖掘序列之间的描述提取新闻需求类别。建立映射关系,根据映射关系建立或更新需求特征词汇。将用户的累计点击次数与预设的点击阈值进行比较,根据高于预设点击阈值的分类结果对应的需求类别,即新闻需求类别,挖掘待挖掘序列之间的描述提取新闻需求类别。建立映射关系,根据映射关系建立或更新需求特征词汇。

  三、获取需求

  1、获取用户查询序列对应的原创搜索结果

  2、获取查询序列对应的候选需求类别

  对原创搜索结果进行处理,根据查询序列,通过查询序列的语义分析或根据查询序列在需求特征词库中匹配查询等手段,得到候选需求类别。例如,当用户的查询序列是“土豆上的热门影视剧”时,进行分词处理得到“土豆/热门影视剧”,因为影视剧这个词有明显的需求类别,比如如视频、下载、图片、演员介绍,对查询序列进行语义分析或在需求特征词库中进行匹配查询,得到候选需求类别。,图片,演员介绍。

  3、根据查询序列和候选需求类别,确定查询序列对应的类别需求度

  根据查询序列和候选需求类别,通过对查询序列对应的搜索结果按类别进行统计分析或对搜索结果按类别对历史点击记录进行统计分析,确定查询序列为对于每个候选需求类别类别需求。例如:“XX影星”,根据查询顺序,得到候选需求类别包括视频、新闻、背景介绍、音乐、图片,然后根据查询顺序和候选需求类别,通过搜索结果对应到查询序列,如按类别进行统计分析或按类别对搜索结果的历史点击记录进行统计分析,以确定查询序列对应的类别需求度,例如查询序列“XX电影明星”的类别需求度视频类别为 0.3;新闻类别中查询序列的类别需求度为0.3;背景介绍类别中查询序列的类别需求度为0.1;音乐类别中查询序列的类别需求度需求度为0.2;图片类中查询序列的类别需求度为0.1。视频类别中查询序列“XX影星”的类别需求度为0.3;新闻类别中查询序列的类别需求度为0.3;背景介绍类别中查询序列的类别需求度为0.1;音乐类别中查询序列的类别需求度需求度为0.2;图片类中查询序列的类别需求度为0.1。视频类别中查询序列“XX影星”的类别需求度为0.3;新闻类别中查询序列的类别需求度为0.3;背景介绍类别中查询序列的类别需求度为0.1;音乐类别中查询序列的类别需求度需求度为0.2;图片类中查询序列的类别需求度为0.1。音乐类别中查询序列的类别需求度需求度为0.2;图片类中查询序列的类别需求度为0.1。音乐类别中查询序列的类别需求度需求度为0.2;图片类中查询序列的类别需求度为0.1。

  需求确定:

  用户的查询序列为“××电影明星”,在需求特征词库中匹配查询该查询序列。在需求特征词库中匹配查询时,发现××电影明星属于明星列表,该明星列表对应需求类别当包括视频、新闻、背景介绍、音乐和图片时,候选需求得到查询序列对应的类别,包括视频、新闻、背景介绍、音乐和图片。结合查询序列对应的大量用户点击的统计分析,例如统计分析结果表明用户点击视频搜索结果、新闻搜索结果、背景介绍搜索结果、音乐搜索结果的频率,

  4、根据品类需求向用户提供搜索结果。

  根据品类需求程度,将搜索结果提供给用户。以“XX影星”为例:当用户查询序列为“XX影星”时,该查询序列在视频类别中的类别需求度为0.3,新闻类为0.3,背景介绍类中的品类需求度为0.1,音乐类中的品类需求度为0.2,图片类别为0.1时,若查询序列的搜索结果列表首页显示10个搜索结果,根据类别需求,视频3个搜索结果,新闻3个搜索结果,背景介绍选择了1个。

  根据品类需求度,将品类需求度和搜索结果提供给用户。具体地,根据查询序列和候选需求类别,通过对查询序列对应的搜索结果按类别进行统计分析或对与该搜索结果相关的历史点击记录按类别进行统计分析,确定该查询序列对应于查询序列。在确定了品类需求度后,通过特殊字体、浮动窗口等方式将搜索结果和搜索结果对应的品类需求度提供给用户。百度已经使用了这种技术,可以在百度搜索结果页面中找到。

  四、结果偏好

  与查询相关的属性至少包括以下任何一项:

  1.搜索结果与查询序列的相关性;

  2.搜索结果的权限;

  3.搜索结果的及时性。

  1.相关性:根据搜索结果对应的品类需求,结合搜索结果与查询序列的相关性,将首选结果提供给相应的用户。当搜索结果对应的新闻搜索结果的品类需求度与音乐搜索结果的品类需求度相同时,将搜索结果对应的品类需求度与搜索结果与查询的相关性结合起来序列,并将搜索结果提供给用户。

  (1)网站 内容是否与网站 主题相关。

  方便搜索引擎找到你网站,方便分类你网站。准确的品类分类对于提升网站在某行业的权威性大有裨益。

  (2)网站中的内容能否满足用户的需求。

  关于这一点的讨论太多了。不一一详述。

  2.权威度:确定查询序列的品类需求度后,将搜索结果对应的品类需求度和搜索结果的权威度结合起来提供给用户,例如:权威度当查询序列对应的音乐搜索结果的权限较低时,依次将查询序列对应的新闻搜索结果和音乐搜索结果提供给对应的用户用户。

  权威不等于知名,知名对权威的反应。

  权威度的计算方法比较复杂,有很多基数可供参考。下面列出了一些“可能”决定权威度的基数。

  (1)网站品牌词的搜索量。

  (2)与 网站 相关的长尾术语的流量。

  (3)直接访问流量。

  (4)在url中体现的权限(在索引库中存在的时间、在搜索中的表现、政府网站等)。

  (5)口耳相传、社交媒体转贴。搜索引​​擎一直在监控用户在互联网上的一举一动。然而,由于一些“原因”,有些是直接影响,有些是间接影响,或者没有效果。但是所有可点击的链接都是有用的。

  (6)网站更新频率。嘿嘿~!这个网站还在维护中,不是死站,短期内不维护(春节放假7天)会影响不大。维修。可能真的会降级。

  (7)页面代码标准化。虽然扣除细节的时代已经过去,但搜索引擎仍然通过源码获取页面信息。适当的降噪可以让搜索引擎更容易判断主要内容和主题、页面结构, 等等。

  (8)所有元标记内容的质量和相关性。tkd 的重要性不言而喻。

  (9)外部投票:百度的外链算法,最近看了百度的文章,好像是:把所有有外链的网站页面都建成一个集合,把其他一些页面的页面结构相似的页面创建一个集合,通过在集合之间交换外部投​​票权重,得到具有相似结构的页面的外部投票权重,加上内部投票权重,等于原创未处理页面的权重。

  (10)相关文章内容是否丰富。(文章数量、质量、图片等)

  3.时效性:搜索结果不仅根据搜索结果对应的品类需求提供给用户,还结合搜索结果的时效性。例如,当查询序列对应的新闻搜索结果的时效性强而查询序列对应的音乐搜索结果的时效性弱时,提供查询序列对应的新闻搜索结果和音乐搜索结果依次给用户。用户。

  在高度时间敏感的内容中更常见。例如,MH370飞机坠毁前,MH370搜索结果页面的主要信息是MH370飞机的预订、介绍等信息。当飞机坠毁时,搜索结果页面随着新闻类别需求的增加而变化。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线