解密seo:搜索引擎优化与网站成功战略(如何分辨搜索引擎之间的细微不同?(1)(组图))

优采云 发布时间: 2021-11-03 15:00

  解密seo:搜索引擎优化与网站成功战略(如何分辨搜索引擎之间的细微不同?(1)(组图))

  搜索引擎是一项大家都非常熟悉的服务。具体来说,首先用户在搜索栏中输入搜索关键词,如“春花夹克”,然后搜索引擎将关键词切分为“春”、“碎花”、“夹克” ”,搜索引擎再次从所有收录这三个关键词网页的网页中抓取页面标题,并按照一定的规则排列给用户。

  以上就是传统搜索引擎的工作模式。这种工作方式是合理的,但仍有遗漏。例如,在上面的例子中,它只会推荐标题为“Spring Floral Jacket”的网页,而不会推荐标题为“Spring Floral Jacket”的网页,并考虑标题为“Spring Floral Jacket”的网页和标题夹克”页面是否为“春季花卉短裤”也并不重要。

  我们无法一一告诉搜索引擎“Fragmented Flower”等同于“Little Flower”,“Tops”比“Jacket”等页面排序规则更重要。这是因为首先这些规则非常多,其次,这些规则总是在变化。好在语义搜索引擎可以通过学习智能分辨关键词之间的细微差别,捕捉用户搜索关键词的真正含义。从根本上解决上述问题。

  

  图语义搜索引擎架构

  图为一个语义搜索引擎的架构,分为七层。

  以 Unicode 和 URI 表示的字符集层和以 XML+NS+xmlschema 表示的根标记语言层是搜索引擎的基础设施。RDF 层为词汇嵌入提供了一个框架。这一层结合了多个词汇来描述 Web 资源。. 这三层属于搜索引擎的基本结构,支撑着搜索引擎的正常运行。

  从本体词汇层面向上是语义搜索引擎的核心内容。本体词汇即本体词汇,该层用于支持知识库的构建。本体是术语的集合,它以术语组的形式描述现实世界中的对象。比如tops的body可以由{季节性、长度、厚度、款式、颜色}等概念组成,季节性的概念变成一个单独的body,由{spring、summer、fall、winter}、length组成{short, medium, long} ... 结合这些本体,我们得到本体词汇。

  本体词汇可以采用半监督的形式形成,即根据过去积累的用户搜索记录提取频繁出现的词汇,人工聚合本体词汇。不同语义搜索引擎的本体词汇很可能是不同的。例如,在沃尔玛百货搜索引擎中,不会出现“数据分析”等技术本体词汇。通过本体词汇,知识库可以将某个关键词转化为概念集合,搜索相关网页。

  

  网页文档和网页数据的图对应关系

  当用户在搜索栏中输入关键词时,语义搜索引擎会找到与关键词相似度高的词和相关度高的词。高相似度是指两组词之间有替代词。关系,比如“破花”可以换成“小花”;高相关性是指两组词总是一起出现,比如“数据分析”和“数据挖掘”总是同时出现。语义搜索引擎在网页中找出相似词和相关词,并根据这些词的数量,按照一定的规则对它们进行排序。

  该图显示了搜索引擎如何从 Web 文档中提取有效数据。图中的每一个纸质图形代表一个真实的网络文档,网络文档中收录的相关词和相似词在图形中用蓝点表示。Web 文档中的点越多,文档的重要性就越高。将相似性和相关性的概念引入搜索引擎将改变原创网页的顺序。有些网页可能不收录所有用户搜索关键词,而只需要收录大量相似的关键词和相关的关键词,就可以获得更好的排名。

  图中的 Logic、Proof 和 Trust 层用于规则的推理和验证。他们通过逻辑推理验证关键词和关键词之间关系的合理性以及搜索结果的顺序。这种验证技术主要基于Proof交换和数字签名技术。一方面杜绝网络钓鱼网站和劣质网站冒充优质网站,另一方面防止不合理的网页排名。从而保证了良好的用户体验。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线