HTML や XML 形式の文書は構造化文書の例です。これらの文書には、 テキスト・フィールドや文書属性を識別するタグが含まれています。 テキスト・フィールドには、文書の表題、作成者、または文書の説明などの情報を含めることができます。 文書属性には数を含めることができます。
以下に示すのは、構造化されたプレーン・テキスト文書の一部です。 HTML のようなタグで区切られたフィールドと属性があります。
[head]Handling structured documents [/head] [abstract]This document describes the concept of structured documents and the use of document models to... [/abstract] : :
構造化文書の索引を作成する場合、Net Search Extender はその構造を認識していなければなりません。 構造を認識することによって、テキスト・フィールドと属性に索引を付けることができ、 またフィールドや属性を識別するユニーク名を指定して、 それらをまとめて保管することもできます。 こうして、Net Search Extender を使用して、特定のテキスト・フィールドを選択的に検索したり、 特定の属性を持つ文書を検索したりすることが可能になります。
Net Search Extender が特定の文書フォーマットを理解できるようにするには、 文書モデル 内の構造の定義を Net Search Extender に渡すことが必要です。
CREATE INDEX コマンドを呼び出して文書に索引を付けるときに、 文書のモデルの名前を引数として指定します。
文書モデルを使用して文書に索引を付ける前に、 まず文書モデルを定義してから、索引に文書モデルを追加することが必要です。