搜索引擎进行信息检索的优化策略方法(搜索引擎进行信息检索的优化策略方法有哪些?-李望柳的回答)
优采云 发布时间: 2021-12-28 09:04搜索引擎进行信息检索的优化策略方法(搜索引擎进行信息检索的优化策略方法有哪些?-李望柳的回答)
搜索引擎进行信息检索的优化策略方法有哪些?-李望柳的回答-知乎搜索引擎进行信息检索的优化策略方法有哪些?
三)进一步优化搜索引擎内容:按照算法流程进行归类维度,进一步进行大体分类;对搜索结果建立索引,单独建立副本库;从页面入手,建立url长度索引系统,
一、从搜索任务说起1.本质上讲信息检索需要一个知识库,即对特定的搜索需求抽象出某个模型下的特定知识来,进而给用户一个相应的搜索路径,用户要按照搜索路径反馈对的结果。我们在抽象出的知识库中对上述三个问题进行了重新划分、优化2.同时在对上述问题进行重新划分、优化的过程中,相应的知识库的抽象层级也要有所提升,这样才能对上述三个问题通过知识库的层级关系进行一一对应,起到更好的解决问题效果。
3.一般的检索算法分为三层结构,分别为分类主干结构、分类支持向量机结构和分类无监督结构。目前在主流检索框架中,将检索框架划分为上述三层,其中主干结构是由查询主线索引进行构建而成,主干索引也称为stagewiki,主干结构分为文档主干索引和知识主干索引;分类主干结构是由查询主线索引进行划分,查询主线索引也可以进行扩展,后续将详细讲解;分类支持向量机结构是分类线索将相应的分类结果固定下来,然后对候选度不高的bestsource进行打分,接着进行分类。这样划分支持向量机结构的原因也在于支持向量机自成体系,基本上是一种统一的分类基准体系。
4.数据维度的划分:
1)数据特点,
2)目标用户的需求;
3)数据规模的大小;
4)索引的长度;
5)处理相关性的速度;一个问题从收集到查询,可能会存在一个较大的规模的,而且用户的需求对结果的影响是比较大的,因此从查询结果中不可能能够判断出某一个结果是否正确;如果数据规模不大且用户的需求小,那么只有一种搜索的结果不错,这样的问题就更适合采用分类或者是聚类的方式进行预测;但如果数据规模很大且用户的需求比较大,那么可能就没有一个合适的查询来进行比较,一般不会进行数据划分。
5.无监督预测技术:无监督预测技术也很常见,一个简单的例子,数据无监督的预测程序并不需要任何的标签,只需要给用户输入一个单词,经过计算,用户说的英文单词之前可能存在着n个单词,至于用户说的是n的几分之几,就不会知道。这种方式的成功需要有特征的不断嵌入的技术。6.全文检索:全文检索用到了大量的全文信息,因此目前大部分的检索算法采用全文信息特征,检索后的结果才会更加贴近用户的。