Analyseprogramm

Ein Analyseprogramm ist ein Lucene-Konzept, das eine Klasse darstellt, die die abstrakte Lucene-Klasse org.apache.lucene.analysis.Analyzer implementiert.

Analyseprogramme bereiten Text für die Indexierung und für Suchvorgänge vor. Es ist beispielsweise nicht sinnvoll, jedes Wort in einem Textfeld zu indexieren. Stoppwörter wie "und", "von" und "ein" sind bei einer Suche möglicherweise irrelevant. Wenn diese Wörter bei einer Feldsuche ignoriert werden sollen, wird das Feld in Tokens zerlegt, d. h. es durchläuft ein Analyseprogramm, bevor das Feld zum Index geschrieben wird. In gleicher Weise wird mit einem Begriffswert verfahren, der durchsucht wird.

Analyseprogramme sind sprachspezifisch. Die Definition eines Wortes ist nicht in allen Sprachen gleich. Einige können so konfiguriert werden, dass allgemeine Stoppwörter (ein, der, wenn usw.), Zahlen etc. ignoriert werden. Die vom Server für generische Suche verwendeten Analyseprogramme können auf der Grundlage des jeweiligen Suchservice konfiguriert werden.