TEMA 5

RECUPERACIÓN DE LA INFORMACIÓN

El proceso de recuperación de la información se lleva a cabo mediante consultas a soportes donde se almacena la información como son las bases de datos, mediante un lenguaje de interrogación adecuado, que es el que le permite "hablar" en el mismo lenguaje que la base de datos. Surge el concepto de sistemas de recuperación de la información: proceso donde se accede a una información ya almacenada, mediante el uso de herramientas informáticas que permiten establecer ecuaciones de búsqueda específicas.

Las herramientas para la búsqueda y recuperación de la información son:

-Bases de datos.
-Internet (buscadores, directorios, revistas electrónicas, metabuscadores, etc)
-Lenguajes de interrogación y ecuaciones de búsqueda.
-Lenguajes de indización y control terminológico (índices, palabras clave, tesauros)
-Bibliotecas y bibliotecas digitales.

Existen operadores para la consulta y la recuperación de los documentos: booleanos (and, or, not), posicionales (near, adj), existencia (presencia, ausencia) y exactitud (por campos, proximidad).

Hay diferentes técnicas de recuperación de la información, todas ellas muy útiles:

-Sistemas de recuperación de lógica difusa: Técnica que permite hacer consultas con frases normales dejando sólo las palabras que el sistema considere relevantes. La recuperación se basa en proposiciones booleanas de true y false.
-Técnicas de ponderación de términos: Se centra en dar un valor adecuado (términos en el documento y su frecuencia) pensando en los intereses del usuario. Los documentos recuperados se encuentran en función del valor obtenido en la ponderación.
-Técnica de clustering: Modelo de probabilidad que se centra en las frecuencias de los términos de búsquedas en los documentos recuperados.
-Técnica de retroalimentación por relevancia: Se basa en determinar unos criterios de búsqueda y observar los documentos recuperados, se vuelva a repetir la consulta con los términos relevantes, seleccionados en los documentos previamente recuperados.
-Técnica de stemming: Se centra en suprimir las posibles confusiones semánticas que se dan en la búsqueda de un concepto, buscando sólo la raíz de la palabra.


Para que la recuperación de la información sea de calidad tiene que ser relevante, precisa, exhaustiva y consistente.

¿Qué técnica de recuperación de la información es para vosotros la más útil?

No hay comentarios:

Publicar un comentario