百度搜索引擎优化指南30( 搜索引擎搜索引擎的缺陷及未来发展趋势个人体会(组图))

优采云 发布时间: 2021-12-28 02:07

  百度搜索引擎优化指南30(

搜索引擎搜索引擎的缺陷及未来发展趋势个人体会(组图))

  

  目前,人们将搜索引擎分为三代。第一代是雅虎的人工编目方式,第二代是谷歌发起的机器搜索,通过“爬虫”采集

海量数据,用户通过关键词进行搜索。第三代是所谓的自然语言搜索。笔者认为,真正意义上的搜索引擎只有一、二代,而三代搜索只是技术上的改进。现有的搜索引擎经过十多年的发展,已经贴近人们的需求,但也逐渐暴露出一些问题和不足。在这里,我想谈谈我个人对搜索引擎的不足和未来发展趋势的体会,

  1 现有搜索引擎的缺陷

  缺陷一:首先,搜索引擎的选择需要根据经验初步选择,还没有形成一套固定的选择原则和方法。

  缺陷二:搜索引擎的信息覆盖率和召回率低。美国科学杂志《自然》的一篇文章曾报道,即使是最大的搜索引擎也只能覆盖当前网络资源的 16%。根据美国 NEC 研究所的两位博士的研究,目前的搜索引擎漏掉率约为 84%。网页信息。尤其是中文搜索引擎在信息规模、收录内容、索引深度等方面都相差甚远。中文信息资源主要是文化、娱乐和商业信息,学术信息稀缺。目前,与西方相比,中国信息资源仅占5%左右。互联网上有超过100亿个网页,搜索量最大,谷歌只能搜索33亿个网页。所以,再大的搜索引擎也不可能有100%的召回率。因此,用户对准确率的要求更高。情况确实如此。当你没有选择合适的引擎来寻找你需要的内容时,你真的找不到它。

  缺陷三:主题搜索引擎太少。目前,大多数搜索引擎都是综合性和通用性的。用户搜索时不相关的信息太多,无法找到更深入的内容。面向学科的引擎很少,这对于专业人士来说是非常不利的。

  缺陷四:目录搜索速度太慢,机器人搜索的可用性不理想。相信大家都会有这种感觉。为了得到想要的结果,从搜索引擎返回的页面仔细搜索,往往需要更换关键词,最终可能得不到想要的答案。

  缺陷五:用户界面简单,不够友好,不能准确表达用户的搜索意图。虽然链接数以千计,但可供用户选择搜索词和搜索结果的功能并不多。大多数搜索引擎不受类型和范围的限制。它们不是面向用户的搜索,而是面向主题的搜索。他们不能重用检索到的历史信息,也不能提供主题跟踪服务。他们对自然语言的理解也很有限。由于各个搜索引擎关键词搜索时使用的符号和含义,分类搜索建立的分类体系和使用规则都不一样,因此用户很难构建搜索公式。网站配置文件不规范,经常误导用户进入广告世界。

  缺陷六:现有搜索引擎在检索功能方面存在问题: ①布尔逻辑符号的组合数量有限;②只用关键词提问,关键词搜索最大的缺点就是信息过载。还有很多无用的信息。关键词 搜索无法整合文档的标题、关键词、内容等方面。它不能自动过滤提取最有价值的内容,也不能自动过滤掉不相关的内容。内容,但是当你使用多个关键词进行限制时,肯定存在信息缺失的问题,不能完全满足用户的需求;③结果简单,让用户头疼,找不到线索;④不可重用检索到的历史信息;⑤受单引擎限制。

  缺陷七:由于搜索引擎采集

信息的方式、索引方式、检索算法、结果排序方式各不相同,加之网络资源复杂分散,信息的组织和索引没有统一的标准。由于每个搜索引擎都有自己的信息采集

方式和范围,不同的搜索引擎在搜索结果的数量和质量上存在明显差异;并且由于它们的索引方式不同,相同的搜索请求在不同的搜索引擎中进行搜索,得到的搜索结果也大不相同。再者,由于网页编译的自发性和随机性,为了让网页制作者为用户提供最“有价值”的网页,搜索引擎通常根据查询的相关程度对搜索结果进行排名。最相关的文件通常排在第一位。但是,由于不同的搜索引擎确定相关性的原则不同,确定相关性的方法不同,排序方式单一,导致关键词搜索输出的结果无法根据用户的需求进行排序;一些网页创作者想提高其网页的点击率和相关性,将一些与网页主题无关的流行词隐式放在页面上并重复多次,或放在Meta Tag中,导致精度不高。确定相关性的方法不同,排序方式单一,关键词搜索输出的结果无法根据用户需求排序;一些网页创作者想提高其网页的点击率和相关性,将一些与网页主题无关的流行词隐式放在页面上并重复多次,或放在Meta Tag中,导致精度不高。确定相关性的方法不同,排序方式单一,关键词搜索输出的结果无法根据用户需求排序;一些网页创作者想提高其网页的点击率和相关性,将一些与网页主题无关的流行词隐式放在页面上并重复多次,或放在Meta Tag中,导致精度不高。

  缺陷八:搜索语言不够规范。具体表现在:分类不够科学,自然语言不够规范,分类主题不够深入,主题索引不够准确。

  缺陷九:检索中出现信息过载,无用信息过多。主要体现在:分类主题检索的输出往往是网站,而不是网页信息,用户进入网站后找不到自己需要的内容,无论是关键词还是主题分类检索,因为信息输出格式简单,无法为用户提供更好的方式和信息。网站和网页都在动态变化。如果旧数据库不及时维护和更新,就会出现无效链接,甚至错误链接或死链接,并且会输出很多重复无用的信息。据统计,平均网页重复率为4。也就是说,当你通过一个网址在互联网上看到一个网页时,平均有 3 个其他不同的 URL 也提供相同或基本相似的内容。这不仅适用于在网络上搜索搜索引擎时。它消耗机器时间和网络带宽资源,如果出现在查询结果中,则无意义地消耗计算机显示资源。即使是一些知名的搜索引擎,也只返回不到 45% 的相关结果。以百度为例。当你输入一个关键词搜索时,返回的结果中有70%~80%的无用信息。它甚至是 100% 没用的。即使是一些知名的搜索引擎,也只返回不到 45% 的相关结果。以百度为例。当你输入一个关键词搜索时,返回的结果中有70%~80%的无用信息。它甚至是 100% 没用的。即使是一些知名的搜索引擎,也只返回不到 45% 的相关结果。以百度为例。当你输入一个关键词搜索时,返回的结果中有70%~80%的无用信息。它甚至是 100% 没用的。

  缺陷十:单一查询方式。大多数搜索引擎提供分类查询和关键词查询方式。但是,不能实现概念检索,不能从信息的各个方面进行检索问题,只能对某个关键词或某个概念进行一般检索。关键词 搜索是通过机械的关键词匹配实现的,缺乏知识处理和理解能力,这意味着搜索引擎无法处理用户非常常见的常识知识,更不用说随机用户了。不同且不断变化的个性化知识、因地域而异的地域知识、因领域而异的专业知识等;缺陷11:检索方式与数据集(即索引库)不匹配。检索方式是指搜索引擎允许用户提交查询表单。不同的用户有不同的信息需求,不可能有通用的方式。一般来说,对于普通网民来说,最自然的搜索方式是“随心所欲”,但这种方式比较模糊。当用户需要一些间接信息时,例如用户想查找“喜马拉雅山的高度”,8 848m应该是他想要的,但是这个数据不能收录

在这个搜索词中。

  缺陷12:网络检索的效果没有统一的评价标准。

  缺陷13:互联网信息的采集受设备条件、网速、经济条件的限制。用户需要花时间等待,影响效率。

  2 搜索引擎未来发展趋势

  趋势一:向智能化发展。智能搜索引擎结合人工智能技术,可以将信息搜索从目前基于关键词的层面提升到基于知识(或概念)的层面。智能搜索引擎可以与用户进行自然语言交互,自然语言搜索符合人们的语言习惯。,就像人与人之间的交流一样简单、直接、方便。不再需要拘泥于分类、关键词等传统搜索方式。这无疑为用户提供了极大的便利。“语言计算”、云搜索服务技术和人工智能的融合,使计算机返回的结果更具针对性,在前两个或三个搜索结果中显示准确信息。让计算机具备人类智能和逻辑分析能力,能够理解自然语言表达的语义,实现搜索结果与用户需求的更精准匹配。

  趋势二:实现搜索引擎与网络资源目录同步支持。网络资源目录是一种基于目录的网络搜索工具,通常称为网络目录,也称为专题目录或主题指南、站点导航系统等。它是网络开发者采集

网络资源、组织它们的查询方法。在某个分类法中,并将它们与检索方法结合起来。从使用的角度来看,网络目录最大的特点是,网络用户在查询信息时,并没有预先确定一个特定的信息搜索目录(关键词)。用户可以根据模糊的主题概念在查询中一步步组织自己的问题,通过分析和匹配自己的思维逻辑和概念组织过程,获取所需信息,逐步明确检索概念的范围和检索要求。这个功能正好弥补了搜索引擎的不足。

  趋势三:向个性化、专业化方向发展。个性化是指通过各种网络检索工具实现内容的专业化和服务的个性化。个性化的核心是跟踪和分析用户的搜索行为,使个性化搜索更符合用户的需求。搜索引擎也应该有自己的特色检索系统,以满足用户对不同领域信息的需求。

  趋势四:向多媒体发展。随着视频、音频等多媒体信息检索次数的快速增加,多媒体搜索引擎的检索结果应该多样化、生动化,以更好地满足用户的需求。

  趋势五:向功能多元化发展。现有的搜索引擎虽然功能齐全,但仍不能满足用户日益增长的需求。①表现为可检索的信息形式多样化;②表现为搜索引擎向其他服务类别的扩展,必须以多种方式满足用户的需求。

  趋势六:向商业化方向发展。随着用户群的不断增长,为电子信息增值服务提供了广阔的空间。网络检索系统成为新的投资热点。搜索引擎不仅是一种技术,更是一种服务形式。它也成为了一个产业。其商业利益已成为系统完善和扩展的主要动力。网络信息的检索和利用从公开向商业化转变。

  趋势七:专业化发展。由于用户的多样性和对信息搜索的不同要求,综合搜索引擎收录

的内容过宽和过大,无法满足特定的需求。专业搜索引擎只专注于特定领域的专业和核心技术。具有针对性强、实用性强的特点,如提供FTP等信息检索。

  趋势八:向视觉信息检索方向发展。即文档信息、用户提问、各种检索模型、以及使用检索模型进行信息检索的过程,都在一个视觉空间中展示,同时为用户提供信息检索服务。这使用户能够更直接、方便、快捷、高效地获取信息和知识。相信随着网络技术的不断发展以及XML、RDF、GRID在信息中的应用,视觉检索必将成为搜索引擎新的发展方向。

  趋势九:提高自然语言回答功能在搜索引擎中的使用。允许用户输入简单的问题句,例如“互联网是什么?” 搜索引擎分析问题的结构和内容后,或者直接给出问题的答案,或者引导用户从几个可选择的问题中重复该问题。选择使查询更加方便、直接、有效,从而提高检索效率。

  趋势十:搜索引擎的技术发展应该专注于搜索结果的处理,提供更加优化的搜索结果。通常我们在检索过程中会有太多的附加信息。为了去除这些多余的附加信息,我们希望使用用户定制和内容过滤等检索技术过滤掉多余的信息。同时大力发展元搜索引擎。由于每个搜索引擎采集到的资源平均只能占整个Web资源的30%到50%,同一搜索请求在不同搜索引擎中的重复率不到34%。准确率小于45%。元搜索引擎将用户提交的搜索请求发送给多个独立的搜索引擎进行搜索,对搜索结果进行统一处理,以统一格式提供给用户。因此,在搜索引擎上方有一个搜索引擎的名称。其主要着眼于提高搜索速度,智能处理搜索结果,个性化的搜索功能设置,以及用户搜索界面的人性化,具有较高的召回率和准确率。

  趋势11:一站式搜索。它将图片、新闻、股票等各种相关信息集成在同一个界面中,让用户一次就可以得到所有的查询。它使用户可以只搜索一个查询目标,并且可以在同一个界面上获取各种相关信息。为。。。。寻找结果。

  趋势12:综合上下文搜索引擎是一种融合个性化、区域定位和社区相关搜索技术的引擎。与其他搜索引擎相比,除了强调搜索结果与用户需求的相关性外,还增加了另一个维度,即搜索结果的依赖性。这种与社区相关的搜索可以为用户提供更准确、更可信的搜索结果;其区域定位系统可为用户提供准确的地理位置服务。根据用户的服务使用习惯建立用户的模块信息。该技术通过捕捉和改进用户信息来学习用户的兴趣行为,从而达到主动推荐的目的。其个性化体现在:①检索。根据用户的行为习惯模式,建立模块兴趣特征库,并根据这些特征对搜索结果进行排序。②个性化推荐。通过用户在同一个模块数据中的数据,提供给正在查询的用户。

  趋势13:提高召回率和准确率。为了提高召回率,必须在搜索引擎的组织机制、索引深度和标准化程度、检索功能、用户界面等各个方面进行改进。可以开发分布式系统,Web信息资源可以与非Web信息资源结合,大大提高召回率。为了提高寻人率,必须在信息过滤、信息索引和信息检索三个方面进行改进。应该使用更有效的算法和更智能的程序来改进。

  趋势14:改进P2P点对点网络搜索技术。P2P搜索技术是指互联网用户在所有用户的硬盘上共享文件、目录甚至整个硬盘。它可以使用户深入搜索文档,无需通过服务器,也不受信息文档格式和主机设备的限制。

  3 结束语

  在技​​术创新突飞猛进的今天,搜索技术也应该跟上时代的进步,“智能化”无疑是我们的方向。希望在未来搜索引擎的发展过程中,能看到更多“人性化”的引擎工具,让搜索更快、更好、更强,让搜索引擎成为我们最亲密的朋友和伙伴!

  [参考]

  [1] 李卓君.搜索引擎问题分析及发展趋势研究[EB/OL].

  [2] 徐建华.网络搜索引擎的原理、特性分析及未来发展趋势[EB/OL].

  [3] 许建英.搜索引擎发展趋势研究[EB/OL].

  [4] 宋婷婷.WEB搜索引擎的设计原理及发展方向[EB/OL].

  [5] 中国学术期刊网.未来搜索引擎发展趋势分析与思考[EB/OL]。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线