搜索引擎介绍
优采云 发布时间: 2020-08-26 15:27搜索引擎介绍
11搜索引擎构架 搜索引擎构架 内容采集接口 二次排序 提交“关键 字”搜索 内容库(线上) 12580平台 标点库 基础词 构建索引客服系统 咨询平台 人工采编 电影 搜索索引 分词模块 分词模块 按评分排序 的搜索结果 基于英文动词 的算法 用户 人工维护分类关 键词库 更新词 营销活动 业务 信息 美食 天气 证券 航班 优采云 其他... 索引库 内容库(线下)搜索引擎流程说明: 将内容从信息源处采集到本地, 解析内容关键词,生成搜索索引 用户递交关键字搜索处理时,系统将用户输入的邮件内容分拆 成关键词,利用关键词到内容库 中进行模糊匹配。 搜索引擎按照特定算法检索出 匹配度较高的内容结果集。 搜索引擎使用自定义的排序算 法对内容结果集进行二次排序, 把二次排序后的内容回复给搜 索用户。 22 搜索引擎 搜索引擎 根据源信息库内容数据,定时建立索引,生成索引文件; 用户恳求搜索时,系统将用户输入的内容分拆成关键词,利用 关键词到索引文件中进行模糊匹配,产生 搜索结果集; 搜索引擎使用自定义的排序算法对内容结果集进行二次排序, 选取最优的匹配结果内容回复用户。 33 搜索引擎 搜索引擎 搜索引擎框架采用开放源代码的搜索引擎Lucene,它具有以下突出的优点: 在传统全文检索引擎的倒排索引的基础上,实现了分块索引,能够针对新的文件构建小文件索引,提升索引速率。然后通过与原有索引的合并,达到优 化的目的。 设计了独立于语言和文件格式的文本剖析插口,方便扩展自定义的中文分词插口。 具有一套强悍的查询引擎,包括模糊查询、分组查询等。44 搜索引擎 搜索引擎 55 搜索引擎 搜索引擎 66 搜索引擎 搜索引擎 77 可以按照切分关键词指定搜索分类内容库。搜索引擎 搜索引擎 输入字符串 分词模块 输出字符串 中文词库 基于英文词库的动词算法 标点库 高频词库 88 搜索引擎 搜索引擎 索引建立索引库分成大库和小库: