Apache Lucene 5.4.0 發布,Java 搜索引擎

admin @ 2015-12-16 , reply:0

Apache Lucene™ 5.4.0 發布,此版本包括大量的 bug 修復,優化和改進,現已提供下載:


Lucene 5.4.0 值得關注的改進:

API 改進
 * Query.getBoost and Query.setBoost are deprecated in favour of the
   new BoostQuery
 * The Filter class is deprecated in favour of FILTER clauses in a
 * DefaultSimilarity has been renamed to ClassicSimilarity to
   prepare for the move to BM25 in Lucene 6

 * New Serbian token filter
 * New DecimalDigitFilter, to fold unicode digits to latin digits
 * New UnicodeWhitespaceTokenizer, that uses Unicode's whitespace
   definition and splits on NBSP
 * New GeoPointDistanceRangeQuery to search for geo-points within
   a ring
 * Query caching is now enabled by default in IndexSearcher, use
   IndexSearcher.setQueryCache(null) to disable

 * MatchAllDocsQuery got faster
 * Doc values now use less memory for multi-valued fields and
   less disk in case of sparse fields
 * Two-phase iterators got a match cost API so that the costly
   bits can be checked last

Bug 修復
 * PatternTokenizer no longer hangs onto heap sized to the maximum input
   string it's ever seen.

Lucene 是apache軟體基金會一個開放源代碼的全文檢索引擎工具包,是一個全文檢索引擎的架構,提供了完整的查詢引擎和索引引擎,部分文本分析引擎。 Lucene的目的是為軟體開發人員提供一個簡單易用的工具包,以方便的在目標系統中實現全文檢索的功能,或者是以此為基礎建立起完整的全文檢索引擎。

Lucene 最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,後來在Excite擔任高級系統架構設計師,目前從事 於一些INTERNET底層架構的研究。他貢獻出Lucene的目標是為各種中小型應用程式加入全文檢索功能。

[admin via ] Apache Lucene 5.4.0 發布,Java 搜索引擎已經有146次圍觀