 | |  | | Conectados: Actualmente hay 6 invitados, 1 miembro(s) conectado(s).
Es un usuario anónimo. Puede registrarse aquí | |  | |  |
|  |
 |
|
 |
|
Patiperros del DCC
CC52D Recuperacion de la Informacion
CC52D Recuperación de la Información
10 UD
- Requisitos
CC31B
- Objetivos
Introducir los conceptos básicos del área necesarios para que el alumno
pueda saber en que circunstacias se puede aplicar sistemas de recuperación
de información.
Proveer los criterios para decidir sobre tecnologías alternativas en
recuperación de información, y entregar los elementos para evaluar el
rendimiento de sistemas de recuperación de información.
Introducir sobre técnicas de almacenamiento, recuperación y actualización
de datos masivos y no estructurados, tales como texto.
- Programa
- Introducción
Conceptos básicos. Recuperación de documentos. Automatización de
bibliotecas. Fichas bibliográficas. Indices KWIC. Thesauri. Bancos de
datos para búsqueda computarizada. Archivos invertidos. Definiciones
básicas de rendimiento (recuperación y precisión).
- Consultas Bibliográficas
Operaciones booleanas, pesos.
- Características de Bancos de Datos de Documentos
Frecuencias de palabras y caracteres. Ley de Zipf. Consideraciones de
Teoría de la Información: contenido de información, códigos de Huffman.
Codificación y compresión: fragmentos, algoritmo de Lempel-Ziv.
- Indexación
Manual vs. automática. Extracción automática de términos y sus pesos:
peso inverso a la frecuencia, razón señal/ruido, valor discriminatorio del
término. Matriz de similaridad de términos. Construcción automática de
therauri. Matriz documentos-términos. Retroalimentación por la relevancia.
Espacio de documentos dinámico. Ordenamiento de documentos por relevancia.
- Rendimiento de un Sistema de Recuperación de Información
Cálculo de la recuperación y precisión. Medidas alternativas. Rendimiento
total de un sistema.
- Agrupamiento de Documentos (Clustering)
Métodos jerárquicos y no jerárquicos. Evaluación de las búsquedas con
clustering.
- Estructuras de Archivos
Archivos invertidos. Archivos de firmas. Arboles PAT y arreglos PAT o de
sufijos.
- Búsqueda Directa en Texto
Algoritmo simple. Algoritmo Knuth-Morris-Pratt. Algoritmo Boyer-Moore.
Algoritmo Karp-Rabin. Algoritmo Shift-Or.
- Enfoques de Hardware
Enfoques: memoria asociativa, máquinas de estado finito, arreglos
celulares. Procesadores ópticos. Competitividad con respecto a archivos
invertidos.
- Metodología
Clases formales. Además, los alumnos deberán efectuar lecturas técnicas
complementarias a las materias vistas en clase. Se pedirá, además, un
pequeño proyecto, consistente, por ejemplo, en el análisis crítico de un
sistema de recuperación de información del mercado, o el diseño preliminar
de características de un nuevo sistema de recuperación de información, o
estudio de alguna tecnología emergente.
- Bibliografía
G. Salton and M. McGill: "Introduction to Modern Information Retrieval".
McGraw-Hill, 1983.
W. Frakes and Baeza-Yates, R.: "Information Retrieval: Data Structures
& Algorithms". Prentice-Hall, 1992.
|
|
 |
|
 |
|