Este modelo es el más popular y conocido de los SRI. Concibe a la base de datos como un inmenso conjunto de documentos y cada búsqueda como un subconjunto de documentos. Emplea el criterio simple de relevancia binaria: un documento es relevante o no lo es, sin término medio y un documento es relevante sólo cuando contiene la palabra solicitada.

Este modelo no discrimina entre documentos más o menos relevantes. Da igual que un documento contenga una vez la palabra solicitada o que la contenga treinta veces (es decir, no considera los pesos de las palabras en los documentos). En una operación de búsqueda en la que se emplea el operador de la Unión no discrimina si se satisface una o varias cláusulas OR. En una operación AND no acepta que se cumplan casi todas las cláusulas (acierto parcial).

El lenguaje natural presenta a veces muchas discrepancias con el lenguaje booleano, especialmente cuando se trata de usuarios no especializados. Es frecuente encontrarnos con ecuaciones de búsqueda donde los usuarios de un SRI que tienen la siguiente necesidad de información "me interesa información sobre la Región de Murcia, su geografía, su gastronomía y su pluviometría", transcriben: REGION AND MURCIA AND GEOGRAFIA AND GASTRONOMIA AND PLUVIOMETRÍA cuando realmente lo que quieren localizar debería escribirse (REGION AND MURCIA) AND (GEOGRAFIA OR GASTRONOMIA OR PLUVIOMETRIA)

Este tipo de error es menos frecuente en el caso de los usuarios más especializados, para quienes este sistema puede llegar a ser efectivo, a pesar de los problemas de relevancia.

Además del operador AND (intersección, el operador más inmediato y sin duda el más utilizado) se suele disponer del operador OR (unión) y NOT (exclusión de un subconjunto de documentos de otro).

esquema funcionamiento modelo booelan

Fuente: Tolosa, G. y Bordigan, F. http://ferbor.blogspot.com/2006/11/modelos-de-recuperacin-de-informacin.html

Responder

CAPTCHA
Esta cuestión es para averiguar si usted es un visitante o si se trata de un acceso tipo 'spam'
Image CAPTCHA
Copy the characters (respecting upper/lower case) from the image.

Sindicación

Distribuir contenido

“Cualquier idiota puede usar un ordenador. De hecho, muchos lo hacen.”
yalova veteriner

Ted Nelson Ingeniero e inventor del término Hipertexto

Inicio de sesión

CAPTCHA
Esta cuestión es para averiguar si usted es un visitante o si se trata de un acceso tipo 'spam'
Image CAPTCHA
Copy the characters (respecting upper/lower case) from the image.