
Fhur N. (1992), "Probabilistic models in Information Retrieval,"
Este modelo es el más popular y conocido de los SRI. Concibe a la base de datos como un inmenso conjunto de documentos y cada búsqueda como un subconjunto de documentos. Emplea el criterio simple de relevancia binaria: un documento es relevante o no lo es, sin término medio y un documento es relevante sólo cuando contiene la palabra solicitada.
Son varios los autores que presentan la evolución de estos sistemas, pero quien mejor simplifica este progreso es Baeza-Yates, destacando tres fases fundamentales:
Ayer leí en IWETEL un mensaje de Jesús Tramullas sobre una página donde hablaban sobre la "Historia de Internet en una nuez". Jesús dice que puede ser discutible pero que algunas imágenes le traen recuerdos. En eso lleva razón.
Uno de los experimentos que llevé a cabo cuando mi tesis doctoral fue intentar determinar la similitud en la respuesta de los motores de búsqueda. Sobre los 30 primeros documentos devueltos por seis motores a 30 preguntas determinamos que la similitud de la respuesta era bastante escasa, alrededor del 15% hacia principios del año 2001.
Dentro del portal OCW ('Open Course Ware') de la Universidad Carlos III de Madrid encontramos el curso denominado Sistemas Avanzados de Recuperación de Información que han desarrollado los compañeros Jorge Morato Lara, Sonia Sánchez Cuadrado y Mónica Marrero Llinares. Resulta interesante disponer de contenidos en nuestro idioma sobre este campo.
Esa expresión del Tenorio es la que se me ha venido a la cabeza al leer la entrevista a Jordi Ribas -Director del Centro Tecnológico de Búsquedas de Microsoft- que aparece hoy en El País.
Google nos permite consultar sus estadísticas desde 2004, para ello debemos a acceder al sitio Google Estadísticas de Búsqueda que nos permite realizar consultas muy variadas. Yo he elegido la opción de ver los sitios más visitados a partir de Google en España desde 2004. He aquí el resultado:
Búsquedas más frecuentes
1. youtube
2. tuenti
3. facebook
4. you
5. google
6. hotmail
7. as
8. marca
9. videos
10. yahoo
Mientras sigo dándole vueltas al post anterior dedicado a los cambios en Yahoo!


