搜索引擎的工作原理(一)(1)_光明网(图)
优采云 发布时间: 2021-05-19 21:08搜索引擎的工作原理(一)(1)_光明网(图)
搜索引擎的定义搜索引擎是指Internet 网站上的一项工作,是指网页中接受问题并检索巨大数据库的部分!其主要任务是主动在Internet上搜索Web服务器信息以形成自动索引。”索引内容存储在可查询的大型数据库中!当用户输入关键词查询时,“此网站会告诉用户全部“收录关键字信息的URL”并提供指向此网站的链接!搜索引擎组成该引擎主要包括以下5个组件#(用于搜索和查找网站的1)搜索引擎Web搜索程序;网页(2)采集网页信息并从其他资源数据库中采集其他网页信息$(3)索引程序”用于索引内部(4)%搜索引擎和“在收到问题请求后”算法以及从索引(或数据库)中获取数据的相关过程$(5) Image(HTML)接口“采集用户的问题数据”并将其发送给搜索引擎!搜索引擎的工作原理与每个引擎基本相同搜索引擎,其中包括以下内容wing 3个方面#(1)使用%Web搜索程序并搜索Internet上的所有信息”,然后将其反馈给搜索引擎!这主要是通过各种URL的网页进行的,这些网页称为%spiders&%robots和网络搜索软件,并将它们记录为一个详尽的网络目录!(2)将信息分类到搜索引擎数据库中!在此过程中,“不同系统会在搜索结果的数量和质量上做出不同的响应。“一页的所有内容都被记录下来,而其他内容则通过分析数据库中的地址被选择来记录最受欢迎站点的信息!所记录的信息主要包括从HTML标题到整个网站的所有文本内容,均由特定的算法处理!(3)通过Web服务器软件“在浏览器界面下为用户提供信息查询!每个搜索引擎都为用户提供了一个不错的解决方案-机器对话界面”,并具有帮助功能!只需输入查询内容,然后在框中输入要查找的关键词或词组,然后按搜索按钮!搜索引擎会根据提示询问用户用户的输入。在索引中找到相应的单词并执行必要的逻辑计算以得出匹配结果!用户只需要相关信息即可通过搜索引擎提供的超文本链接进行访问!目前搜索引擎的选择是“世界上有10,000多个搜索引擎”,数十个知名的Web级搜索引擎,以及各个领域的数百个专业搜索引擎“中国有一百多个搜索引擎”。搜索引擎(包括香港,澳门和台湾)。”由于软件开发和使用对象的不同,使用的效果也不同。” 关键词“临沂师范学院图书馆”中的搜索引擎检索策略研究(山东临沂276005)(关键词搜索是Google的基本搜索功能文章在阐述了搜索引擎的基本属性和选择方法之后,“重点分析了搜索引擎中关键字的应用技巧和优化策略!关键词#搜索引擎$ 关键词 $检索中途分类号#M250 !!!!!文学识别码#!!!!!! 文章 ID#1002-1248'2007(08-0115-03 StudyonSearchStrategyofSearchEngineBasedonKeywords冯遵华(临沂师范学院图书馆,临沂276005)摘要:关键词的搜索是搜索引擎的基本检索功能。该论文详细阐述了搜索引擎的基本特征和选择方法,然后分析了关键词,以强调搜索引擎的技能和优化策略为关键词。发布日期#2007-01-12作者简介#本科学位“临沂师范学院图书馆”副研究员图书馆员发表论文20余篇!农业图书馆和情报杂志,+ 23 +-#* 4,5 /#+ 67/8 + 789选择性能更好的搜索引擎评估指标主要包括“([1)搜索引擎的#亲和度$%智能信息过滤,挖掘和推送技术以及学习功能”(2)准确率%是搜索结果中相关信息与搜索结果的比率(3)召回率%指搜索结果中的相关信息与搜索引擎数据库中相关信息的比例!(4) 关键词是否支持布尔逻辑组合?这是用户对信息的个性化要求,也是对信息专业性要求的提高%。这也是对准确性的需求!搜索结果无效链接率!如果检索到的结果与摘要中的用户需求相符,%用户在单击链接时应该能够查看它们!(6)正在检索回应时间到了!如今,随着网络速度的不断提高,%用户对结果的响应时间的要求也越来越高!有针对性地选择合适的搜索引擎搜索引擎的适应范围和搜索功能具有其自身的特点%为了不同的目的进行搜索时,应选择不同的搜索引擎!通过使用不同的搜索引擎查询所获得的结果通常非常大!当问题明确后,信息的准确性应提高%。搜索时,请尝试使用主题搜索引擎%。 GoraSearch&MLPapers和CiteServer是专门针对计算机人工智能和机器学习的研究方向的搜索引擎(ChemFinder为化学家提供)化学物质信息检索(Botanyonline是一个以植物学含量为中心的专业搜索引擎(对于科学信息%,请使用AltaVista或Excel)当寻找不太受欢迎的信息时,例如AltaVista或Hot-Bot!如果您想获得更多的系统信息,则可以使用目录搜索引擎的搜索功能,例如使用Yahoo!使用多个搜索引擎!多个搜索引擎只需要输入关键词可以查询多个搜索引擎%具有检索效率和单个搜索引擎无法匹配的效果!这种方法的特点是效率高,可以在多个数据库中同时搜索% Searchspaniel可以同时查询200多个搜索引擎!推荐的多搜索引擎Dogpile&Ixquick&Profusion&SurfW ax&Sav * y和其他国内搜索引擎!刚刚在SoasoBar%中,它使用了Google中文+百度&HC和Skynet数据(此*敏*感*词*%可以大大提高搜索结果的准确性! fic research%,一个主题通常不是一个关键词,它可以被概括,并且必须在逻辑上与多个单词组合在一起,才能准确地反映出主题。前面提到的*图书馆采访工作$ 关键词必须具有*逻辑或$操作!主要是“使用布尔搜索。所谓布尔搜索%”是指通过标准布尔逻辑关系表示关键词一种查询%之间的逻辑关系的方法,使我们可以输入多个关键词%之间的每个关键词之间的关系可以用逻辑关系表示)常用的是“和(逻辑AND)&或(逻辑非(逻辑非)&附近(两个词的接近度)%使用双引号进行精确搜索)如果关键字是词组或多个中文字符%,最好的方法是将它们括在双引号%中,以便%可以得到较少且精确的结果)Google搜索*如果引用的项目查询结果%为49700,且不带引号,则首选$%1790 )使用加号和减号来限制搜索)许多搜索引擎支持在关键词之前加一个加号(+)来限制必须收录在搜索结果中的单词%号(-)限制不能收录的单词在搜索结果中!当搜索结果太大时,“使用&小说+中国文学-长篇小说$)(3)使用括号将关键词分开分组”有助于使搜索结果非常准确!3 .3.2优化搜索结果!以对上一次搜索的结果进行另一次搜索”,以便进一步缩小搜索范围,然后才可以对搜索结果进行多次优化搜索。除了搜索首次输入的关键字*敏*感*词*!最后,“优化关键词”并重新搜索!如果有更多搜索结果,则可以选择高度特定的搜索关键词缩小搜索范围*如果搜索结果较少,则“您可以重新选择扩展的上位词搜索”或选择多个反映相同内容的关键词(可以是同义词,甚至是同义词) 关键词“可以控制召回率和准确性”的不同选项。如上所述,“在对图书馆采访员的主题进行第二次搜索之后,“尽管搜索结果准确无误。”在类似的学科和信息科学之外,也将“影响召回率”。因此,有必要进一步优化逻辑关系)为了提高准确率,许多搜索引擎提供了短语检索功能)短语检索优于单词检索搜索结果更相关)可以使用更具体的输入的词汇和技术术语用于检索+的关键词越具体,则表示“找到所需信息的可能性越大”。精度越高!注意阅读引擎的帮助信息。许多搜索引擎提供了操作%运算符和使用规则。通过使用多个搜索引擎和仅使用一个引擎很难保证召回率。 “特别是搜索引擎在不断变化的URL和超链接点上运行!不同的网站和超链接点采集程序会生成不同的数据库。”结果是不同的。 “使用多个引擎比较获得的结果”不会造成重大遗漏!使用多种方法“使用大量数据优化搜索结果”和具有自动截断单词的引擎,尤其是Excel,Hotbot,Lycos等。许多搜索结果”,特别是内容过多的问题。“提高搜索结果的准确性”有两种主要方法(一种是通过短语搜索,每个引擎的字段搜索%,接近运算符, *第二个方法是使用某些“优化”功能!如果要扩展搜索结果!首先,“在搜索项方面,搜索拼写是否正确?”是否可以添加同义词?第二,“尝试其他引擎”或使用多引擎集合搜索工具!再次,可以使用“概念搜索(例如Excel)”,“相似页面搜索”和其他方式。“用于没有明确目的的搜索要求或没有明确目的的搜索主题一开始就清除。”建议使用具有主题分类搜索功能的引擎,例如Excel“ YahooEtc。对特定问题的特定分析。用户可以使用各种信息搜索方法,例如“按主题搜索”和“按区域搜索”,以按关键词进行搜索。使用搜索方法来掌握和灵活使用各种搜索策略。 “根据自己选择正确的用户。需要将“信息搜索技术开发的各种信息浏览方法和信息快速浏览技术相集成”。Internet可以快速找到您需要的信息资源!信息获取技术[M]。清华大学出版社,2003。邱凤祥。搜索引擎的使用策略[J]。华东理工学院学报(社会科学版),2004,(4):97-100。陆小琴。搜索引擎的选择与检索策略[J]。情报科学,2002,(4):417-419。蔡志成,王志华。搜索引擎的主要特征及其检索策略[J]。现代信息, 2005,(5):151-153。冯遵华(基于关键词的搜索引擎检索策略研究