Para documentos filtrados HTML, XML y Outside In, Net Search Extender proporciona modelos de documento por omisión que se utilizan si no se define un modelo de documento. Para documentos de texto plano estructurados, es necesario proporcionar y especificar un modelo de documento.
Si utiliza uno de los modelos de documento por omisión:
Tipo de documento | Comportamiento del modelo de documento por omisión |
---|---|
HTML | Acepta los siguientes campos de texto: <a> <address>
<au> <author> <h1> <h2> <h3> <h4>
<h5> <h6> <title>.
El nombre de campo es el nombre de identificador como, por ejemplo, "address". |
XML | Acepta todos los identificadores como campos de texto.
El nombre de campo es el nombre de vía de acceso completamente calificada del identificador, por ejemplo "/play/title". |
Texto plano estructurado (GPP) | Ningún modelo de documento por omisión. |
Outside In (INSO) | Acepta como campos de texto, las propiedades del documento que se muestran en el apartado Parámetros de elementos tal como las devuelven los filtros Outside In. El Nombre de campo es el nombre de la propiedad del documento que Outside In utiliza, por ejemplo: "SCCCA_TITLE". |
Para cada tipo de documento se define un modelo de documento. Como todos los modelos son diferentes, se proporciona un ejemplo y una explicación para cada uno.
Nota |
---|
Aunque los modelos de documento por omisión procesan los documentos correctamente, para mejorar la indexación y la búsqueda debería definir sus propios modelos de documento. Con el modelo de documento por omisión, el texto de un documento se indexa completamente, sin tener en cuenta si forma parte de un campo de texto o no. Esto significa que las búsquedas de texto no restringidas incluirán una búsqueda de este texto. |
El siguiente es un ejemplo de un documento de texto plano estructurado de finalidad general (GPP):
[head]Manejo de documentos estructurados [/head] [year]2002 [/year] [abstract]Este documento describe el concepto de los documentos estructurados y la utilización de modelos de documento para... [/abstract]
A continuación se muestra un ejemplo de un modelo de documento GPP:
<?xml version="1.0"?> <GPPModel> <GPPFieldDefinition name="Head" start="[head]" end="[/head]" exclude="YES" /> <GPPFieldDefinition - Éste es el inicio del campo de texto name="Abstract" start="[abstract]" end="[/abstract]" exclude="NO" /> - Éste es el final de un campo de texto <GPPAttributeDefinition - Éste es el inicio de un atributo de name="year" documento start="[year]" end="[/year]" type="NUMBER" /> - Éste es el final de un atributo de documento </GPPModel>
La primera línea, <?xml version="1.0"?> especifica que el modelo de documento está escrito con identificadores XML. Tenga en cuenta que este modelo no está escrito para documentos en formato XML.
Cada campo se define con un identificador GPPFieldDefinition o GPPAttributeDefinition, que contiene parámetros de elemento.
Todas las definiciones deben estar contenidas en el identificador <GPPModel>.