博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Lucene 3.6 contrib 学习总结
阅读量:6119 次
发布时间:2019-06-21

本文共 1031 字,大约阅读时间需要 3 分钟。

  hot3.png

analyzers :  各种分词器 以国家、语言、功能进行分类
grouping : 分组统计 ,可以对各Field进行几个级别的搜索结果中field值的统计
highlighter : 高亮,搜索结果Document中的空间向量文本进行高性能高亮
icu:  开始不知道它是干嘛呢,既然有分词的实现咋不放入 analyzers包中呢,详细的看后,http://site.icu-project.org/ 发现它的定义。提供标准国际化编码UTF-8支持。 实用价值不大。
instantiated : 好像是 实时搜索有关,从包名称中推里其内容为搜索对象初始化相关
join: 连接时查询, 看事例代码,主要突出  父类 、及子类 query 和 同时包含 2者的查询,支持相互之间的查询时进行查询
memory: 内存相关。只有一个类:MemoryIndex,实现序列化, 官方介绍:高性能单文档主内存的全文检索和索引。 实现简单在内存中索引、存储索引、查询、算法计算等,针对小数据量,但要求快速索引的可以选择
misc:其他相关项
pruning : 英文单词的google 翻译是修剪, 是的,pruning是用来缩减lucene索引大小的。在readme中 官方使用Static index pruning tools. 静态索引修剪工具来描述。在大索引的企业索引中也是蛮有用处的。
queries: 解析 + || @ 等操作符 封装为query 和 相反的从query到查询公式字符串
queryparser: 高一层的在搜索逻辑上封装 Query 
remote: 远程搜索,使用java RMI技术,没多大实用价值
spatial: geo地图中位置范围查询,基于将坐标转换为数值型进行范围查询,还有这模块将会在4.0中做较大更新,做geo搜索的创业型公司来说,这是件非常棒的事情
spellchecker: 以前版本就有了,不过这次较多的提升了性能和准确率。 这就是类google 搜索时,提示相关关键词功能的实现
xml-query-parser: 基于xml的query 和 query Parser,企业级索引服务用的比较多,实现方式不一这一种,索引多数企业是自己实现这块。
Lucene 3.6 更多的是提升性能。 期待4.0,带来更多的搜索相关的新功能。

转载于:https://my.oschina.net/so1y/blog/54554

你可能感兴趣的文章
[SCOI2005][BZOJ 1084]最大子矩阵
查看>>
学习笔记之Data Visualization
查看>>
Leetcode 3. Longest Substring Without Repeating Characters
查看>>
【FJOI2015】金币换位问题
查看>>
数学之美系列二十 -- 自然语言处理的教父 马库斯
查看>>
Android实现自定义位置无标题Dialog
查看>>
面试总结
查看>>
Chrome浏览器播放HTML5音频没声音的解决方案
查看>>
easyui datagrid 行编辑功能
查看>>
类,对象与实例变量
查看>>
HDU 2818 (矢量并查集)
查看>>
【转】php字符串加密解密
查看>>
22. linux 常用命令
查看>>
ASP.Net 使用GridView模板删除一行的用法
查看>>
(十六)字段表集合
查看>>
JPGraph
查看>>
实验二 Java面向对象程序设计
查看>>
------__________________________9余数定理-__________ 1163______________
查看>>
webapp返回上一页 处理
查看>>
新安装的WAMP中phpmyadmin的密码问题
查看>>