IBM Books
(C) IBM Corp. 2000

DB2 Extension Net Search - Guide d'administration et d'utilisation

Zones de texte et attributs de document

Un modèle de document vous permet d'identifier les parties ou sections de document qui soit appartiennent à une zone de texte spécifique, sont soit un attribut de document, soit les deux.

Zones de texte

Le texte d'un document est totalement indexé qu'il fasse ou non partie d'une zone de texte. Lorsque le modèle de document identifie le texte comme appartenant à une zone de texte, il est considéré comme faisant partie du contenu textuel du document et est indexé normalement. Autrement dit, les termes significatifs sont extraits et stockés dans l'index. Ceci signifie que les recherches de texte illimitées incluent une recherche dans ce texte.

Ainsi, vous pouvez faire une recherche sélective d'un texte dans une zone particulière. Vous pouvez, par exemple, rechercher des documents contenant le mot structure dans la zone de texte Abstract.

Une zone de texte peut apparaître plusieurs fois dans un même document. Vous pouvez, par exemple, définir une zone de texte contenant toutes les légendes des figures. Une zone de texte peut également chevaucher une autre zone de texte.

Si vous ne souhaitez pas indexer le contenu de certaines zones de texte, vous pouvez spécifier une définition de zone contenant exclude="YES". Vous trouverez une liste des limites pour les zones de texte et les attributs à la section Limites des zones de texte et des attributs de document.

Attributs de document

Les attributs de document contiennent des informations formatées, brèves de type nombre. Vous pouvez utiliser des fourchettes de valeur pour rechercher des documents contenant ces attributs.

Les attributs ne sont pas stockés avec le texte indexé, mais dans un index des éléments distinct. Ainsi, pour rechercher un document par le contenu d'un attribut, vous devez faire une recherche spécifique sur l'attribut.

Attributs de nombre

L'Extension Net Search fournit un analyseur qui reconnaît les nombres en virgule flottante. Vous trouverez ci-après quelques exemples de formats corrects et incorrects pour les valeurs INTEGER.

Tableau 6. Comportement des modèles de document par défaut pour les formats de document pris en charge

Format correct Format incorrect
1000
1 000
1.000 - où le point est un caractère décimal
1,000
100 000
100 000.00123
1 000 000 - deux espaces entre 1 et 0

Notez que les espaces ne sont pas autorisés dans les fractions décimales d'un nombre. Exemple : 1 000.000 100 est traité comme deux nombres, 1000.000 et 100.

Les séparateurs de langue et les formats monétaires spécifiques ne sont pas pris en charge.


[ Début de page | Page précédente | Page suivante | Table des matières | Index ]