EXTRACCIÓN DE INFORMACIÓN (EI)

INTRODUCCIÓN A LA EXTRACCIÓN DE INFORMACIÓN (EI)

La Recuperación de Información es la estrategía más común para hacer frente al caos que existe hoy día en la red. La presencia de una inmensa cantidad de textos en formato electrónico ha provocado dos grandes problemas:

  • "Infoxicación", la sobreabundancia de la información.
  • Las dificultades para obtener información útil.

La Recuperación de Información (RI) y la Extracción de Información (EI) son las dos estrategías que se plantean para hacer frente a esta situación. La diferencia entre ambos dos conceptos es la siguiente:

  • Recuperación de Información (RI), (en inglés Information Retrieval IR) es una ciencia interdisciplinaria que se centra en la búsqueda de documentos, de información concreta dentro de los documentos, etc. Se refiere al hecho de obtener documentos que satisfagan una necesidad de información del usuario.
  • Extracción de Información (EI), (en inglés Information Extraction IE) es una disciplina dentro del Procesamiento del Lenguaje Natural (PLN) que se centra en localizar y extraer de las partes del texto que contengan información relevante, con el fin de satisfacer una necesidad concreta del usuario; y a su vez, proporcionar dicha información de forma adecuada para su procesamiento.

La Extracción de Información (EI) se considera un tipo de Recuperación de Información (RI) y su importancia viene dado por la creciente cantidad de información no estructurada que existe en Internet.

Siguiente: Sistemas de Extracción de Información (SEI)

SECCIONES

Creado por: Iratxe Urien Larrabide

Sistemas Avanzados de Recuperación de Información (SARI) 2009, Universidad Carlos III de Madrid

Última actualización: 18/05/2009

RDF Resource Description Framework Test de accesibilidad web versión 3 Valid HTML 4.01 Transitional ¡CSS Válido! FOAF RSS¡Suscribete a RSS EI!