analyzers : 各种分词器 以国家、语言、功能进行分类
grouping : 分组统计 ,可以对各Field进行几个级别的搜索结果中field值的统计
highlighter : 高亮,搜索结果Document中的空间向量文本进行高性能高亮
icu: 开始不知道它是干嘛呢,既然有分词的实现咋不放入 analyzers包中呢,详细的看后,http://site.icu-project.org/ 发现它的定义。提供标准国际化编码UTF-8支持。 实用价值不大。
instantiated : 好像是 实时搜索有关,从包名称中推里其内容为搜索对象初始化相关
join: 连接时查询, 看事例代码,主要突出 父类 、及子类 query 和 同时包含 2者的查询,支持相互之间的查询时进行查询
memory: 内存相关。只有一个类:MemoryIndex,实现序列化, 官方介绍:高性能单文档主内存的全文检索和索引。 实现简单在内存中索引、存储索引、查询、算法计算等,针对小数据量,但要求快速索引的可以选择
misc:其他相关项
pruning : 英文单词的google 翻译是修剪, 是的,pruning是用来缩减lucene索引大小的。在readme中 官方使用Static index pruning tools. 静态索引修剪工具来描述。在大索引的企业索引中也是蛮有用处的。
queries: 解析 + || @ 等操作符 封装为query 和 相反的从query到查询公式字符串
queryparser: 高一层的在搜索逻辑上封装 Query
remote: 远程搜索,使用java RMI技术,没多大实用价值
spatial: geo地图中位置范围查询,基于将坐标转换为数值型进行范围查询,还有这模块将会在4.0中做较大更新,做geo搜索的创业型公司来说,这是件非常棒的事情
spellchecker: 以前版本就有了,不过这次较多的提升了性能和准确率。 这就是类google 搜索时,提示相关关键词功能的实现
xml-query-parser: 基于xml的query 和 query Parser,企业级索引服务用的比较多,实现方式不一这一种,索引多数企业是自己实现这块。
Lucene 3.6 更多的是提升性能。 期待4.0,带来更多的搜索相关的新功能。