Este modelo es el más popular y conocido de los SRI. Concibe a la base de datos como un inmenso conjunto de documentos y cada búsqueda como un subconjunto de documentos. Emplea el criterio simple de relevancia binaria: un documento es relevante o no lo es, sin término medio y un documento es relevante sólo cuando contiene la palabra solicitada.
Este modelo no discrimina entre documentos más o menos relevantes. Da igual que un documento contenga una vez la palabra solicitada o que la contenga treinta veces (es decir, no considera los pesos de las palabras en los documentos). En una operación de búsqueda en la que se emplea el operador de la Unión no discrimina si se satisface una o varias cláusulas OR. En una operación AND no acepta que se cumplan casi todas las cláusulas (acierto parcial).
El lenguaje natural presenta a veces muchas discrepancias con el lenguaje booleano, especialmente cuando se trata de usuarios no especializados. Es frecuente encontrarnos con ecuaciones de búsqueda donde los usuarios de un SRI que tienen la siguiente necesidad de información "me interesa información sobre la Región de Murcia, su geografía, su gastronomía y su pluviometría", transcriben: REGION AND MURCIA AND GEOGRAFIA AND GASTRONOMIA AND PLUVIOMETRÍA cuando realmente lo que quieren localizar debería escribirse (REGION AND MURCIA) AND (GEOGRAFIA OR GASTRONOMIA OR PLUVIOMETRIA)
Este tipo de error es menos frecuente en el caso de los usuarios más especializados, para quienes este sistema puede llegar a ser efectivo, a pesar de los problemas de relevancia.
Además del operador AND (intersección, el operador más inmediato y sin duda el más utilizado) se suele disponer del operador OR (unión) y NOT (exclusión de un subconjunto de documentos de otro).

Fuente: Tolosa, G. y Bordigan, F. http://ferbor.blogspot.com/2006/11/modelos-de-recuperacin-de-informacin.html

