IBM Books
(C) IBM Corp. 2000

Net Search Extender 管理およびユーザーズ・ガイド

GPP 文書を索引付けするとどうなるか

汎用パーサーは、開始境界ストリングの 1 つを検索して文書をスキャンします。開始境界ストリングを検出すると、対応する終了境界ストリングを検出するまで、後続のフィールドを解析します。

次に、定義用語に従って、つまりテキスト・フィールドまたは文書属性として、フィールドの内容に索引が付けられます。テキスト・フィールドと文書属性が同じ開始境界ストリングと終了境界ストリングをもつ場合、フィールドの内容には、テキスト・フィールドおよび文書属性の両方として索引が付けられます。

フィールドのネスティングは許可されていません。終了境界ストリングに到達する前に 新たな開始境界ストリングが検出されると、新たな開始境界ストリングは通常のテキストとして解釈されます。

対応する終了境界ストリングが検出されない場合、フィールドは文書の終わりまで拡張していると想定されます。その場合は適切な理由コードが報告されます。

文書モデルで終了境界ストリングが指定されない場合、新規の開始境界ストリングが直前のフィールドの終了のシグナルを出します。


[ ページのトップ | 前ページ | 次ページ | 目次 | 索引 ]