Lucene 2.9 上,终于在 Searchable 接口中支持 search(weight, filter, collector) 了,而不是像 2.4 中那样,只在 IndexSearcher 中支持,而在 MultiSearcher 中,需要自己手工的添加 Collector。 把原来的非常丑陋的 HitCollector 换成了一般丑陋的 Collector ,本来觉得还挺高兴的,但仔细一看代码前的注释:“This API is experimental and might change in incompatible ways in the next release.” 无语了。
虽然 API 还是实验性的,但看起来已经到达了可用的阶段,所以 IMobile Search 2.0 中,还是使用 Lucene 2.9 的 API ,将原来临时性质的 groupby 功能实现重构了一下,大致思路是这样的:
- 使用 Collector 实现
- 实现一个 抽象类 o.a.l.search. ... (全文...)
http://club.blogbeta.com/82.html
beta技术沙龙·大型网站的lucene搜索实战
时间:7月26日14点30分开始
地点:奇遇花园咖啡馆 http://storygarden.me/cafe/map
主题:大型网站的lucene搜索实战
演讲简介:本次活动介绍基于Lucene的站内搜索的实践,后台技术层面的一些想法与实践,包括缩短更新周期,简化重建索引流程,支持大数据量频繁更新的索引,以及在性能和可用性方面作的努力。
主讲人:唐福林 (http://blog.fulin.org https://twitter.com/tangfl)
主讲人简介:从 ... (全文...)
LinkedIn 发布了一个 key-value 存储(发布?)系统 Voldemort,详细介绍在
http://project-voldemort.com/blog/2009/06/building-a-1-tb-data-cycle-at-linkedin-with-hadoop-and-project-voldemort/
抽空看了一下,写了个 ppt 简单介绍:
本文 只是简单的翻译,原文 在 http://wiki.apache.org/lucene-java/ImproveIndexingSpeed
* Be sure you really need to speed things up.
Many of the ideas here are simple to try, but others will necessarily add some complexity to your application. So be sure your indexing speed is indeed too slow and the slowness is indeed within Lucene.
* 请确认你真的需要更快的索引速度
这里的很多想法都非常容易尝试,但也有一些会给你的程序带来额外的复杂度。所以请确认你的搜索速度 ... (全文...)
本文 为简单翻译,原文在:
http://wiki.apache.org/lucene-java/ImproveSearchingSpeed
* Be sure you really need to speed things up.
Many of the ideas here are simple to try, but others will necessarily add some complexity to your application. So be sure your searching speed is indeed too slow and the slowness is indeed within Lucene.
* 请确认你真的需要更快的搜索速度
这里的很多想法都非常容易尝试,但也有一些会给你的程序带来额外的复杂度。所以请确认你的搜索速度 ... (全文...)
imobile 站内搜索 —— 基于 lucene 的站内搜索,阶段性成果介绍
关键词:准实时搜索,及时更新,快速重建,可配置,可监控,高性能
实现:分离读写,分离索引和存储,拆分大小库,新索引 reopen,新索引预热