Flexibleres Lucene - Titelthema: Lucene-TokenStream-API


Contact
uschindler [ at ] pangaea.de

Abstract

Die freie Volltextsuchmaschine Lucene wird momentan gründlich renoviert. Der Artikel stellt das neue TokenStream API als eine der aktuellen Erweiterungen vor. Es ermöglicht es Nutzern von Lucene, jedem indexierten Wort (Term bzw. Token) typisierte Attribute zuzuordnen und diese später mit flexible Indexing auch im Index abzuspeichern. Am Beispiel der Eigennamenerkennung zeigt der Artikel wie das neue TokenStream API genutzt werden kann und welche Vorteile es gegenüber dem alten Verfahren hat.



Item Type
Article
Authors
Divisions
Programs
Peer revision
Not peer-reviewed
Publication Status
Published
Eprint ID
22634
Cite as
Drost, I. and Schindler, U. (2010): Flexibleres Lucene - Titelthema: Lucene-TokenStream-API , Java Magazin, 7 , pp. 40-44 .


Share

Research Platforms
N/A

Campaigns


Actions
Edit Item Edit Item