Bienvenido a CADCC.CL Centro de Alumnos Departamento de Ciencias de la Computacion
Departamento de Ciencias de la Computación   Escuela de Ingenieria y Ciencias   Universidad de Chile


Inicio · Temas ·  Tu Cuenta
 
 

 
 
Temas

· Inicio
· Departamento
· Actualidad
· Docencia
· Alumnos
· Recreación
· Actividades
· Trabajo
· Histórico
· CADCC 2002
 
 

 
 
Servicios

· Principal
· Temas
· Estoy Harto!
· Galerías Fotos
· Recomiendanos
· Crea tu Cuenta
· Publicar Noticia
· Estadisticas
· Top 10
 
 

 
 
Conectados:

Actualmente hay 6 invitados, 1 miembro(s) conectado(s).

Es un usuario anónimo. Puede registrarse aquí
 
 

 
 

Patiperros del DCC

CC52D Recuperacion de la Informacion

CC52D Recuperación de la Información
10 UD

  1. Requisitos
  2. CC31B

  3. Objetivos
  4. Introducir los conceptos básicos del área necesarios para que el alumno pueda saber en que circunstacias se puede aplicar sistemas de recuperación de información.

    Proveer los criterios para decidir sobre tecnologías alternativas en recuperación de información, y entregar los elementos para evaluar el rendimiento de sistemas de recuperación de información.

    Introducir sobre técnicas de almacenamiento, recuperación y actualización de datos masivos y no estructurados, tales como texto.

  5. Programa
    1. Introducción Conceptos básicos. Recuperación de documentos. Automatización de bibliotecas. Fichas bibliográficas. Indices KWIC. Thesauri. Bancos de datos para búsqueda computarizada. Archivos invertidos. Definiciones básicas de rendimiento (recuperación y precisión).
    2. Consultas Bibliográficas Operaciones booleanas, pesos.
    3. Características de Bancos de Datos de Documentos Frecuencias de palabras y caracteres. Ley de Zipf. Consideraciones de Teoría de la Información: contenido de información, códigos de Huffman. Codificación y compresión: fragmentos, algoritmo de Lempel-Ziv.
    4. Indexación Manual vs. automática. Extracción automática de términos y sus pesos: peso inverso a la frecuencia, razón señal/ruido, valor discriminatorio del término. Matriz de similaridad de términos. Construcción automática de therauri. Matriz documentos-términos. Retroalimentación por la relevancia. Espacio de documentos dinámico. Ordenamiento de documentos por relevancia.
    5. Rendimiento de un Sistema de Recuperación de Información Cálculo de la recuperación y precisión. Medidas alternativas. Rendimiento total de un sistema.
    6. Agrupamiento de Documentos (Clustering) Métodos jerárquicos y no jerárquicos. Evaluación de las búsquedas con clustering.
    7. Estructuras de Archivos Archivos invertidos. Archivos de firmas. Arboles PAT y arreglos PAT o de sufijos.
    8. Búsqueda Directa en Texto Algoritmo simple. Algoritmo Knuth-Morris-Pratt. Algoritmo Boyer-Moore. Algoritmo Karp-Rabin. Algoritmo Shift-Or.
    9. Enfoques de Hardware Enfoques: memoria asociativa, máquinas de estado finito, arreglos celulares. Procesadores ópticos. Competitividad con respecto a archivos invertidos.

  6. Metodología
  7. Clases formales. Además, los alumnos deberán efectuar lecturas técnicas complementarias a las materias vistas en clase. Se pedirá, además, un pequeño proyecto, consistente, por ejemplo, en el análisis crítico de un sistema de recuperación de información del mercado, o el diseño preliminar de características de un nuevo sistema de recuperación de información, o estudio de alguna tecnología emergente.

  8. Bibliografía
  9. G. Salton and M. McGill: "Introduction to Modern Information Retrieval". McGraw-Hill, 1983.

    W. Frakes and Baeza-Yates, R.: "Information Retrieval: Data Structures & Algorithms". Prentice-Hall, 1992.

 

 
 


 
 
Centro de Alumnos del Departamento de Ciencias de la Computación
Facultad de Ciencias Físicas y Matemáticas
Universidad de Chile
Web site powered by PHP-Nuke

 
 
Google