분석기

분석기는 Lucene org.apache.lucene.analysis.Analyzer 추상 클래스를 구현하는 클래스를 나타내는 Lucene 개념입니다.

분석기는 색인화와 검색을 위한 텍스트를 준비합니다. 예를 들어, 텍스트 필드의 모든 단어가 색인화되는 것은 의미가 없습니다. "and", "of", "a"와 같은 검색 엔진에서 제외되는 단어는 검색과 무관할 수 있습니다. 필드 검색 중이 이들이 무시되는 경우 필드는 토큰화됩니다. 즉, 필드를 색인에 쓰기 전에 분석기를 통과하며, 검색되는 용어 값도 마찬가지입니다.

분석기는 언어 특정입니다. 즉, 단어 정의 내용은 모든 언어에서 동일하지 않습니다. 일부는 공통으로 검색 엔진에서 제외되는 단어(an, the, if, etc)를 무시하거나 숫자를 무시하는 등으로 구성될 수 있습니다. 일반 검색 서버에서 사용되는 분석기는 검색 서비스에 대한 기초에서 구성 가능합니다.