搜索引擎优化高级编程(查询该集合的主要特性和设置文本分析(一))
优采云 发布时间: 2022-01-26 11:12搜索引擎优化高级编程(查询该集合的主要特性和设置文本分析(一))
还可以通过通过 http 接收 XML/JSON 响应来完成对集合的查询。其主要特点包括:高效灵活的缓存能力、垂直搜索能力、高亮搜索结果、通过索引复制提高可用性、一套强大的Data Schema来定义字段、类型和设置文本分析、提供基于Web的管理界面等.
2.Solr 的优缺点
优势:
Solr 拥有一个更大、更成熟的用户、开发人员和贡献者社区。支持添加多种格式的索引,如:HTML、PDF、Microsoft Office系列软件格式,以及JSON、XML、CSV等纯文本格式。Solr 更加成熟稳定。在不考虑索引的情况下搜索会更快。
缺点:
建立索引时,搜索效率下降,实时索引搜索效率不高。
弹性搜索
1.ElasticSearch 简介
ElasticSearch 是一个基于 Lucene 构建的开源、分布式、RESTful 搜索引擎。专为云计算而设计,可实现实时搜索,稳定可靠,速度快,安装使用方便。支持使用基于 HTTP 的 JSON 进行数据索引。
2.Elasticsearch 的优缺点
优势:
Elasticsearch 是分布式的。不需要其他组件,分发是实时的,称为“推送复制”。Elasticsearch 完全支持 Apache Lucene 的近实时搜索。处理多租户不需要特殊配置,而 Solr 需要更高级的设置。Elasticsearch 采用网关的概念,使完整的备份变得更容易。每个节点形成一个点对点的网络结构,当一些节点发生故障时,会自动分配其他节点代替它们工作。
缺点:
不够自动化(不适合当前新的 Index Warmup API)3.Elasticsearch vs Solr 对比总结
总之,Solr 是传统搜索应用的强大解决方案,但 Elasticsearch 更适合新兴的实时搜索应用。
狮身人面像
1.狮身人面像简介
Sphinx是一个基于SQL的全文搜索引擎,专为一些脚本语言(PHP、Python、Perl、Ruby)搜索API接口而设计。
Sphinx是一个用C++语言编写的开源搜索引擎,也是比较主流的搜索引擎之一。它在索引事件方面比 Lucene 快 50%,但索引文件是 Lucene 的两倍。一方面是为事件交换空间的策略。在检索速度上,它和 lucene 差别不大,但在检索准确率上,Lucene 比 Sphinx 好。此外,在添加中文分词引擎的难度方面,Lucene 优于 Sphinx。其中Sphinx支持实时搜索,使用起来比较简单方便。
Sphinx 可以轻松地与 SQL 数据库和脚本语言集成。当前系统内置了对 MySQL 和 PostgreSQL 数据库数据源的支持,也支持从标准输入中读取特定格式的 XML 数据。通过修改源代码,用户可以自己添加新的数据源(例如:原生支持其他类型的DBMS)
2.狮身人面像功能
多于!