搜索引擎进行信息检索的优化策略方法(信息检索1.放大搜索范围逻辑及技巧介绍-苏州安嘉)

优采云 发布时间: 2021-12-09 20:20

  搜索引擎进行信息检索的优化策略方法(信息检索1.放大搜索范围逻辑及技巧介绍-苏州安嘉)

  信息检索1.简介

  我们每天都需要搜索,但是我们可能经常遇到没有我们想要的结果。但实际上有一些技巧可以帮助我们。首先是我们找不到想要的结果,通常要么是找到的结果太多,要么根本就没有相关的结果。这通常是范围控制的问题。很多时候我们需要适当缩小或扩大搜索范围。或者使用其他方法。以下是一些常用但不全面的检索技术。

  2. 扩大搜索范围逻辑 OR: or, +

  首先,我们需要将某个关键词的同义词、上位词、下位词全部放起来,并用+号连接起来,即把每个关键词的搜索结果加在一起并呈现出来。这样,搜索结果就会大大增加。

  3. 细化搜索范围1. 逻辑与:空格

  很多时候,我们会搜索一个很长的句子,但为了更简洁,我们其实可以去掉一些无意义的词,然后用空格将剩余的词分开,这样效率会更高。

  2. 逻辑非:不是,-

  逻辑上通常是我们要从搜索结果中去除某些结果,我们用-来表示去除。

  3. 词组搜索

  当我们要搜索专有名词时,例如组织名称,我们可以使用双引号将搜索词括起来,这意味着不需要扩展。因为如果不这样做,搜索引擎会自动对词进行分词,比如“词组搜索”,可能会分为“词组”和“搜索”,这两个词的位置可能会发生变化。当然,保持两个关键词位置不变也是可以的。有兴趣的可以搜索“位置检索”。

  4. 搜索引擎命令

  site命令用于通过搜索引擎强大的搜索功能,搜索某个网站的内容。因为一般的网站,搜索功能无法与搜索引擎相比。所以用搜索引擎强大的搜索功能来代替网站的内部搜索。另一个优点是搜索引擎有快照功能,后面会讲到。

  

  site命令只能指定网站,也就是域名。但是一个 网站 通常有多个级别的路由。为了节省时间,如果我们知道这个路由,我们可以使用inurl命令指定路由来更准确地找到我们想要的内容。

  用于搜索特定的文件格式。我们一定会在网上找到简历模板。很多时候我们搜索word文档或者百度文档。但是,一些大牛的一些简历是用excel写的。如果我们想找到这些简历,我们可以使用filetype来指定文件格式为Excel简历。

  

  该命令返回的结果是页面标题收录关键词。

  4. 使用特定的 网站 或垂直搜索引擎

  百度、谷歌等搜索引擎被称为通用搜索引擎。它们信息量大,综合性强,但深度不够,挖掘的内容很多。比如学术论文肯定比百度好。搜索图片,Pinterest(一个网站)绝对比谷歌图片好。所以善于寻找一些相关的垂直搜索引擎或者专门针对某些内容的网站,会大大提高我们的搜索效率。

  但是对于一些网站来说,它的搜索功能还不够强大。所以我们可以使用 site 命令使用通用搜索引擎来完成它。

  5. 快照

  当搜索引擎抓取网页时,会将网页缓存在服务器中,称为快照。当网页更新或失效时,搜索引擎仍会保存该网页的快照。当我们检索到这个网页时,如果它已经失效,可能是这个网站删除了这个网页。但是当我们想看到这个页面的内容时,可以使用快照功能。这也是为什么在上面讲site命令的时候建议使用搜索引擎查找网站的内容。

  6. 寻找相似的 网站

  有时候我们找到一个网站,觉得还不错,但还是有一些不满意的。这时候我们可以用一个chrome插件:SimilarSites找类似的网站,看看有没有更好的。这比我们回到搜索引擎搜索时效率更高。

  

  7. 自建资源集合

  其实,从某种角度来说,我们还是会踏入同一条河流,遇到同样的问题。因此,对您以前的搜索结果发表一些评论并保存它们。以后可以在笔记中搜索同样的问题,效率会更高。此外,如果您有自己的原创评论,则无需花时间理解它们。

  我们在这里推荐 Evernote 和 diigo。两者都可以保存网页,而且如果我们使用chrome插件,在搜索引擎上搜索时,旁边会出现Evernote和diigo的搜索结果,相当方便。

  

  搜索引擎工作流程

  这是为了让大家更了解搜索引擎。

  简单来说,搜索引擎的工作过程大致可以分为三个阶段。

  1. 爬行

  搜索引擎蜘蛛通过链接访问页面,获取页面的HTML代码并存入数据库。

  这里需要注意的是,搜索引擎蜘蛛的资源是有限的,所以以下几点是影响蜘蛛注意力的因素。

  2. 预处理

  搜索引擎对抓取到的页面数据文本进行文本提取、分词、去停用词、索引等处理,为排名程序调用做准备。其实这里还有一点就是要停词。

  3. 排名

  用户输入搜索词后,搜索引擎调用索引库数据,计算相关性和值,然后进行排序呈现给用户。

  搜索引擎优化

  为什么要在文章信息检索中讲SEO?事实上,搜索引擎优化和信息检索并没有那么密切相关。SEO 只是为了让您对搜索引擎有另一个看法。另外,我了解搜索引擎的工作流程,顺便扩展一下我的知识,因为我这里讲的非常简单和肤浅。

  1. 简介

  搜索引擎优化(Search Engine Optimization,简称SEO)是一种利用搜索引擎的搜索规则,以提高网站在相关搜索引擎中的排名为目的的方式。

  研究发现,搜索引擎用户往往只关注搜索结果的前几项,所以很多网站希望通过各种形式影响搜索引擎的排名。要想影响排名,就要让自己的网站更容易被搜索引擎理解和接受,让搜索引擎感兴趣,就有SEO。

  2. 原理

  如上所述,搜索引擎使用蜘蛛程序通过跟踪链接来访问页面,并获取页面的HTML 代码并将其存储在数据库中。所谓搜索引擎蜘蛛,其实就是一个程序。程序不像人那么复杂。它有一个固定的模式。相对而言,它们不如人类聪明。因此,当搜索引擎蜘蛛抓取您的网站页面时,在预处理过程中,您可以更好地帮助它对网站网页代码进行切分、分析和索引。如果。可以获得更好的结果。

  外部链接是从其他网站 链接到目标网站 的链接。不管是外链还是同一个网站的内链,为了被蜘蛛爬取,必须有导入链接才能进入页面,否则蜘蛛没有机会知道存在这一页。

  换句话说,这个网页应该有一个条目,供搜索引擎蜘蛛抓取页面内容。网页的网址是一个入口点,但是如果要搜索引擎获取的网址,就不能让它猜到。所以我一般都是把自己的网站链接加到其他网站上,我的网站内链可以遍历网站的所有页面,很容易让搜索引擎蜘蛛抓取您的页面。

  搜索引擎排名算法的步骤之一是评估该页面的价值。其中一个因素是查看此页面的其他 网站 链接的数量和价值。这是为了增加搜索引擎对网站的兴趣或关注。

  总结 搜索往往是为了控制搜索范围,这可以通过一些操作符和搜索引擎命令来实现。保持搜索词简洁。快照有时会为您提供帮助,例如当 Web 链接失败时。记得评论并保存你认为有价值的搜索结果(包括一些对你有价值的网站,垂直搜索引擎)。善用插件。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线