‘Since the 1940s the problem of information storage and retrieval has attracted increasing attention’. Keith Rijsbergen. Information Retrieval, chapter 1. 1979

El pasado 6 de octubre en ojobuscador aparecía la siguiente noticia: "Hace unas semanas Google “afirmó” que en su sistema no se utilizaba el meta-tag “keywords” a la hora de tenerse en cuenta para que un sitio aparezca mejor o peor en un sitio web. Ahora es Yahoo! la que comenta lo mismo, aunque, personalmente, no creo que sea así. Estos comentarios realizados por trabajadores de Yahoo!

dominios .com

A veces pienso que soy algo mayor cuando le cuento cosas a mis alumnos (nacidos la mayoría el mismo año que comencé a dar clases en la Uni) del origen de Internet. Lo cierto es que no debo extrañarme de ello cuando leo que el primer dominio .com fue registrado por una empresa (ya desaparecida) llamada symbolics.com y que de esa fecha hace ya 25 años. Como dice Gabo: "vivir para contarla" aunque me tomen por "abuelete".

Este modelo es el más popular y conocido de los SRI. Concibe a la base de datos como un inmenso conjunto de documentos y cada búsqueda como un subconjunto de documentos. Emplea el criterio simple de relevancia binaria: un documento es relevante o no lo es, sin término medio y un documento es relevante sólo cuando contiene la palabra solicitada.

Son varios los autores que presentan la evolución de estos sistemas, pero quien mejor simplifica este progreso es Baeza-Yates, destacando tres fases fundamentales:

Historia de intener

Ayer leí en IWETEL un mensaje de Jesús Tramullas sobre una página donde hablaban sobre la "Historia de Internet en una nuez". Jesús dice que puede ser discutible pero que algunas imágenes le traen recuerdos. En eso lleva razón.

Uno de los experimentos que llevé a cabo cuando mi tesis doctoral fue intentar determinar la similitud en la respuesta de los motores de búsqueda. Sobre los 30 primeros documentos devueltos por seis motores a 30 preguntas determinamos que la similitud de la respuesta era bastante escasa, alrededor del 15% hacia principios del año 2001.

Dentro del portal OCW ('Open Course Ware') de la Universidad Carlos III de Madrid encontramos el curso denominado Sistemas Avanzados de Recuperación de Información que han desarrollado los compañeros Jorge Morato Lara, Sonia Sánchez Cuadrado y Mónica Marrero Llinares. Resulta interesante disponer de contenidos en nuestro idioma sobre este campo.

Esa expresión del Tenorio es la que se me ha venido a la cabeza al leer la entrevista a Jordi Ribas -Director del Centro Tecnológico de Búsquedas de Microsoft- que aparece hoy en El País.

Sindicación

Distribuir contenido

“R2D2, ¿te lo dijo la computadora central de la ciudad? ¡R2D2, sabes bien que no debes confiar en una computadora extraña!”

C3PO, robot de protocolo.

Inicio de sesión

CAPTCHA
Esta cuestión es para averiguar si usted es un visitante o si se trata de un acceso tipo 'spam'
Image CAPTCHA
Copy the characters (respecting upper/lower case) from the image.