IBM Books
(C) IBM Corp. 2000

Manual de administración y del usuario de DB2 Net Search Extender

Argumento de búsqueda

Sintaxis de los argumentos de búsqueda

>>-+----------------------+--+-------------------------+-------->
   '-RESULT LIMIT--número-'  '-EXPANSION LIMIT--número-'
 
>--+------------------------------------------+----------------->
   '-STOP SEARCH AFTER--número--+-DOCUMENT--+-'
                                '-DOCUMENTS-'
 
>--+-| expresión-búsqueda-booleana |-+-------------------------><
   '-| argumento-textolibre |--------'
 
Expresión-búsqueda-booleana:
 
|--+-| Término-búsqueda |---------------------------------------------------+--|
   '-| expresión-búsqueda-booleana |--| operador-or |--| Término-búsqueda |-'
 
Término-búsqueda:
 
|--+-| factor-búsqueda |----------------------------------------------------+--|
   +-| Término-búsqueda |--| operador-and |--| factor-búsqueda |------------+
   +-| Término-búsqueda |--| operador-accum |--| factor-búsqueda |----------+
   '-| Término-búsqueda |--| operador-minus |--| factor-búsqueda-positivo |-'
 
Factor-búsqueda:
 
|--+-----+--| factor-búsqueda-positivo |------------------------|
   '-NOT-'
 
Factor-búsqueda-positivo:
 
|--+-+--------------------------------------------------------------+--| principal-búsqueda |-+--|
   | |                  .-,------------------------------------.    |                         |
   | |                  V                                      |    |                         |
   | '-+-SECTION--+--(----"nombre-sección"--+----------------+-+--)-'                         |
   |   '-SECTIONS-'                         '-WEIGHT--número-'                                |
   '-factor-atributo--------------------------------------------------------------------------'
 
Principal-búsqueda:
 
|--+-| literal-texto |---------------------+--------------------|
   +-| condición-contexto |----------------+
   +-| invocación-diccionario-tesauro |----+
   +-(--| expresión-búsqueda-booleana |--)-+
   '-(--| lista-literales-texto |--)-------'
 
Operador-and:
 
|--&------------------------------------------------------------|
 
Operador-or:
 
|--|------------------------------------------------------------|
 
Operador-accum:
 
|--ACCUM--------------------------------------------------------|
 
Operador-minus:
 
|--MINUS--------------------------------------------------------|
 
Condición-contexto:
 
|----| argumento-contexto |--| IN-SAME |--| unidad-contexto |--| AS |--| argumento-contexto |---->
 
>--+---------------------------------+--------------------------|
   | .-----------------------------. |
   | V                             | |
   '---AND--| Argumento-contexto |-+-'
 
Argumento-contexto:
 
|--+-| literal-texto |------------------+-----------------------|
   +-(--| lista-literales-texto |--)----+
   '-| invocación-diccionario-tesauro |-'
 
Lista-literales-texto:
 
   .-,-------------.
   V               |
|----literal-texto-+--------------------------------------------|
 
Unidad-contexto:
 
|--+-PARAGRAPH-+------------------------------------------------|
   '-SENTENCE--'
 
Literal-texto:
 
|--+---------------------------------------+-------------------->
   +-PRECISE-FORM-OF-----------------------+
   +-STEMMED-FORM-OF-----------------------+
   '-FUZZY-FORM-OF--+--------------------+-'
                    '-nivel-coincidencia-'
 
>--+----------------+--"palabra-o-expresión"-------------------->
   '-WEIGHT--número-'
 
>--+---------------------------+--------------------------------|
   '-ESCAPE--"carácter-escape"-'
 
invocación-diccionario-tesauro:
 
|--THESAURUS--"nombre-diccionario tesauro"--EXPAND-------------->
 
>--+-+-SYNONYM------------+--TERM OF--| literal-texto |--------------------------+--|
   | +-RELATED------------+                                                      |
   | '-RELATION--(número)-'                                                      |
   '-+-BROADER--+--TERM OF--| literal-texto |--+-------------------------------+-'
     '-NARROWER-'                              '-FOR--número total--+-LEVEL--+-'
                                                                    '-LEVELS-'
 
Factor-atributo:
 
|--ATTRIBUTE--"nombre-atributo"--------------------------------->
 
>--+-BETWEEN--valorDesde AND valorHasta-+-----------------------|
   +->--valorDESDE----------------------+
   '-<--valorHASTA----------------------'
 
argumento-textolibre:
 
|--IS-ABOUT--+--------+--"palabra-o-expresión"------------------>
             '-idioma-'
 
>--+---------------------------+--------------------------------|
   '-ESCAPE--"carácter-escape"-'
 
 

Ejemplos

En Especificación de los argumentos de búsqueda de SQL se proporcionan ejemplos.

Parámetros de búsqueda

RESULT LIMIT número
Palabra clave que especifica el número máximo de resultados que la búsqueda de texto completo debe devolver.

RESULT LIMIT se debería utilizar conjuntamente con la función SCORE para garantizar que los resultados devueltos se valoren y que sólo se procesen los mejores resultados.

EXPANSION LIMIT número
Palabra clave que especifica el número máximo de veces que un término se puede ampliar para la búsqueda. Por ejemplo, para determinar cuántas veces se puede ampliar el término de búsqueda 'a*'.

STOP SEARCH AFTER número DOCUMENTS(S)
Palabra clave que especifica el umbral de búsqueda. La búsqueda se detiene cuando se llega al número de documentos durante la búsqueda y se devuelve un resultado intermedio. Un valor inferior aumentará el rendimiento de la búsqueda pero puede dar lugar a un número inferior de resultados y puede que se omitan documentos con un rango potencialmente alto.

Tenga en cuenta que no hay ningún valor por omisión y que el valor número debe ser un entero positivo.

expresión-búsqueda-booleana
Es posible combinar los términos-de-búsqueda y los factores-de-búsqueda utilizando los operadores booleanos NOT, AND, OR, ACCUM y MINUS según los diagramas de sintaxis. Los operadores tienen el siguiente orden de prioridad (empezando por el mayor): NOT > MINUS = ACCUM = AND > OR. Esto puede observarse en el ejemplo siguiente:
"Piloto" MINUS "pasajero" &  "vehículo" | "transporte" & "público"

se evalúa como:

(("Piloto" MINUS "pasajero") & ("vehículo")) | ("transporte" & "público")

El operador ACCUM evalúa como cierto si uno de los argumentos booleanos evalúa como cierto (que es comparable a cómo actúa el operador OR). El valor de rango se calcula acumulando los valores de los dos operandos. El operador ACCUM tiene el mismo enlace (prioridad) que AND. El operador MINUS evalúa como cierto si el operando de la izquierda evalúa como cierto. El valor de rango se calcula tomando el valor de rango del operando de la izquierda y restándole una penalización, si el operando de la derecha evalúa como cierto.

principal-búsqueda
Una búsqueda principal que consiste en una invocación-diccionario-tesauro evalúa como cierto si se encuentra alguno de los literales-texto ampliados en la (sección especificada del documento). Una principal-búsqueda, que consiste en una lista-literales-texto evalúa como cierta si se encuentra alguno de los literales-texto en la (sección especificada del documento).

SECTION(S) nombre-sección

Palabra clave que especifica una o varias secciones de un documento estructurado a las que debe limitarse la búsqueda. El nombre de sección debe especificarse en un archivo de modelos especificado durante la creación del índice. Vea CREATE INDEX.

Los nombres de secciones son sensibles a las mayúsculas y minúsculas. Asegúrese de que los nombres de sección del archivo de modelos y de la consulta sean idénticos.

Este modelo describe la estructura de los documentos que contienen secciones identificables por lo que es posible realizar búsquedas individuales en el contenido de estas secciones. El nombre de las secciones no puede enmascararse con caracteres de máscara. El factor-búsqueda-positivo que utiliza la cláusula SECTION evalúa como cierto si se encuentra el principal de búsqueda en una de las secciones.

Argumento-contexto IN SAME unidad-contexto AS argumento-contexto AND argumento-contexto...
Esta condición le permite buscar una combinación de literales-texto que aparecen en el mismo párrafo o en la misma frase. Los argumentos de contexto siempre son equivalentes a las listas-literales-texto y es posible utilizar una ampliación del diccionario tesauro para ampliar un literal-texto a dicha lista.

La condición evalúa como cierto si hay una unidad-contexto (párrafo respectivamente a frase) en el documento que contenga por lo menos uno de los literales-texto del argumento-contexto ampliado. Esto puede observarse en el ejemplo siguiente:

("a","b") IN SAME PARAGRAPH AS ("c","d")
          AND THESAURUS "t1" EXPAND SYNONYM TERM OF "e".

Suponiendo que e1 y e2 son sinónimos de e, los párrafos siguientes coincidirían:

".. a c e .." ,  ".. a c e1..",  "a c e2..",
".. a d e .." ,  ".. a d e1..",  "a d e2..",
".. b c e .." ,  ".. b c e1..",  "b c e2..",
".. b d e .." ,  ".. b d e1..",  "b d e2..".

PRECISE FORM OF
Palabra clave que hace que la palabra (o cada palabra de la expresión) que sigue a PRECISE FORM OF se busque exactamente como se ha escrito. Esta forma de búsqueda es sensible a mayúsculas y minúsculas; es decir, la utilización de letras mayúsculas o minúsculas es significativa. Por ejemplo, si busca ratón, no hallará "Ratón".

STEMMED FORM OF
Palabra clave que hace que la palabra (o cada palabra de la expresión) que sigue a STEMMED FORM OF se reduzca a la raíz de la palabra antes de que se lleve a cabo la búsqueda. Esta forma de búsqueda no es sensible a las mayúsculas y minúsculas. Por ejemplo, si busca ratón, hallará "Ratón".

La forma en que las palabras se reducen a su forma raíz depende del idioma. Actualmente sólo se da soporte al inglés y la palabra debe seguir las terminaciones de inflexión regulares.

FUZZY FORM OF
Palabra clave para realizar una búsqueda "inexacta", que es una búsqueda de términos que se escriben de forma similar al término de búsqueda. Esto es particularmente útil cuando se realizan búsquedas en documentos que se han creado mediante un programa de Reconocimiento óptico de caracteres (OCR). Dichos documentos incluyen normalmente palabras escritas incorrectamente. Por ejemplo, la palabra economía podría ser reconocida por un programa OCR como econonía. Tenga en cuenta que los tres primeros caracteres deben coincidir y que la búsqueda inexacta no puede utilizarse si una palabra del átomo de búsqueda contiene un carácter de máscara.

nivel de coincidencia
Entero entre 1 y 100 que especifica el grado de similitud, donde 100 es más similar que 1. 100 especifica una "coincidencia exacta" y 60 ya se considera un "valor muy inexacto". Cuando más inexacto sea el nivel de coincidencia, el tiempo necesario para la búsqueda será mayor, ya que los documentos válidos en la búsqueda son más numerosos. El nivel de coincidencia por omisión es 70.

WEIGHT número
Asocia un literal-texto con un valor de peso para cambiar el resultado por omisión. Los valores de peso permitidos son enteros entre 0 (el peso de resultado más bajo) y 1000 (el más alto); el valor por omisión es 100.

palabra-o-expresión
Palabra o expresión que se debe buscar. Los caracteres que se pueden utilizar en una palabra dependen del idioma. También depende del idioma la necesidad de separar las palabras con caracteres separadores. En inglés y en la mayoría de los demás idiomas, cada palabra de una expresión debe ir separada por un carácter en blanco.

Para buscar una serie de caracteres que contenga comillas, escriba las comillas dos veces. Por ejemplo, para buscar el texto carácter "comodín", utilice:

"carácter" "comodín""" 

Tenga en cuenta que, en el ejemplo, sólo se puede buscar un conjunto de comillas. No se pueden buscar dos comillas en una secuencia. También hay una longitud máxima de 128 bytes para cada palabra o frase.

Caracteres de máscara
Una palabra puede contener los siguientes caracteres de máscara.

_ (subrayado)
Representa cualquier carácter individual.

% (porcentaje)
Representa cualquier número de caracteres arbitrarios. Si una palabra consta de un solo signo %, representa una palabra opcional de cualquier longitud. Una palabra no puede estar compuesta exclusivamente de caracteres de máscara, excepto cuando se utiliza un solo signo % para representar una palabra opcional. Si se utiliza un carácter de máscara, no es posible utilizar el DICCIONARIO. Los caracteres de máscara no pueden seguir a un carácter no alfanumérico.

ESCAPE carácter de escape
Un carácter que identifica al carácter que sigue como uno que debe buscarse y no como uno que debe utilizarse como carácter de máscara. Por ejemplo, si $ es un carácter de escape, $%, $_ y $$ representan %, _ y $ respectivamente. Cualquier carácter % y _ no precedido por $ representa un carácter de máscara.

THESAURUS nombre-diccionario tesauro
Palabra clave que se utiliza para especificar el nombre del diccionario tesauro que debe utilizarse para expandir el literal-texto. El nombre del diccionario tesauro es el nombre de archivo (sin la extensión) de un diccionario tesauro que se haya compilado utilizando el compilador de diccionarios tesauros. Debe encontrase en <dependiente-sist-oper>/sqllib/db2ext/thes. También puede especificarse la vía de acceso antes del nombre de archivo.

EXPAND relación
Especifica la relación que se utiliza para expandir el literal-texto que utiliza el diccionario tesauro. El diccionario tesauro tiene relaciones predefinidas que se describen en el mandato DB2EXTTH. Para hacer referencia a las mismas, se utilizan las palabras clave siguientes:

Con las relaciones definidas por el usuario, utilice RELATION(número), que se corresponde con la definición de la relación de DB2TEXTTH.

TERM OF literal-texto

El literal-texto al que deben añadirse del diccionario tesauro otros términos de búsqueda.

número total LEVELS

Palabra clave utilizada para especificar el número de niveles (la profundidad) de los términos del diccionario tesauro que se utilizarán para expandir el término de búsqueda para una relación determinada. Si no especifica esta palabra clave, presupone un número total de 1. El valor de la profundidad debe ser un valor entero positivo.

ATTRIBUTE nombre-atributo
Búsquedas de documentos con atributos que coinciden con la condición especificada. El nombre-atributo hace referencia al nombre de una expresión de atributo del mandato CREATE INDEX o a una definición de atributo del archivo de modelos de documentos.

Sólo se permite el factor-atributo para atributos de tipo doble. La precisión del valor está garantizada por 15 dígitos. Los números de 16 caracteres o más se redondean. No se permite la utilización de caracteres de máscara en nombre-atributo, el valorDesde ni el valorHasta. Para obtener una explicación, considere lo siguiente:

BETWEEN valorDesde AND valorHasta
Un factor de atributo BETWEEN evalúa como cierto si el valor del atributo es mayor que (no igual a) valorDesde y menor que (no igual a) valorHasta.

>valorDesde
Un factor de atributo ">" evalúa como cierto si el valor del atributo es mayor que (no igual a) valorDesde.

<valorHasta
Un factor de atributo "<" evalúa como cierto si el valor del atributo es menor que (no igual a) valorHasta.

Si el nombre de atributo del mandato CREATE INDEX se especifica entrecomillado o se define en un archivo de modelos, el nombre de atributo especificado debe coincidir exactamente. Mientras que si no se especifican las comillas en el mandato CREATE INDEX, el nombre de atributo debe estar en mayúsculas.

IS ABOUT idioma palabra-o-expresión
Opción que permite especificar un argumento de búsqueda de texto libre. Debería utilizarse para obtener un tipo de algoritmo de resultado distinto, ya que comprueba la posición de los términos en los documentos. Cuanto más juntos estén los términos utilizados en la palabra-o-expresión, se incluirán más términos en el documento y se devolverá un valor de resultado más alto.

Los valores permitidos para idioma se describen en el Apéndice E, Idiomas soportados y sólo resultan relevantes para el tailandés. Si no se especifica ninguno, se utiliza el idioma en_US por omisión. El idioma sólo se utiliza para los símbolos de la palabra-o-expresión.

Tenga en cuenta que IS ABOUT sólo resulta útil si se solicitan los valores del resultado y los resultados de la búsqueda se ordenan por valores de resultado.


[ Principio de página | Página anterior | Página siguiente | Contenido | Índice ]