LYS

Linguaxes Naturais

Facultade de Informática da Coruña
Enxeñería Informática
Curso 2009-2010

Esta página en español

For Erasmus students: this page in English



Índice:


Nota: existe tamén unha páxina oficial da asignatura no servidor web da facultade.

NOTA IMPORTANTE: A información mostrada nestas páginas ofrécese a título meramente informativo e non substitue á información oficial publicada nos medios correspondentes.


Profesores


Aulas e horario

NOTA: a clase do vienres 9 de outubro será na AULA 3.1

Programa

  1.  Introdución
    1. Niveis de análise
    2. Ambigüedade
  2.  Recursos lingüísticos
    1. Xogos de etiquetas
    2. Diccionarios
    3. Textos etiquetados
    4. Bancos de árbores
  3. Análise léxica
    1. Segmentación de textos
    2. Morfoloxía flexiva e derivativa
    3. Modelización de grandes diccionarios
    4. Autómatas finitos acíclicos deterministas numerados
    5. Tradutores de estado finito e morfoloxía de dous niveis
  4. Etiquetación
    1. Modelos de Markov ocultos
    2. Execución eficiente dos modelos de Markov ocultos
    3. Técnicas de suavizado
    4. Tratamento de palabras descoñecidas
    5. Aprendizaxe de etiquetas baseado en transformacións e dirixido polo erro
  5. Análise sintáctica: gramáticas independentes do contexto
    1. Esquemas de análise sintáctica
    2. Análise ascendente
    3. O algoritmo de Earley
    4. Autómatas a pila e programación dinámica
    5. Análise sintáctica LR xeralizada
    6. Representación compartida das árbores de análise sintáctica
    7. Análise sintáctica probabilística
  6. Análise sintáctica: gramáticas suavemente dependentes do contexto
    1. Gramáticas de adxunción de árbores
    2. Análise sintáctica de gramáticas de adxunción de árbores
    3. Autómatas para a análisise de gramáticas de adxunción de árbores
    4. Representación compartida das árbores de derivación
    5. Gramáticas de adxunción de árbores probabilísticas
  7. Análise semántica
    1. Estruturas de rasgos e formalismos baseados en unificación
    2. Relacións léxicas. WordNet e EuroWordnet
  8. Recuperación de información (RI)
    1. Conceptos básicos
    2. Modelos de recuperación: booleano, vectorial e probabilístico
    3. Os procesos de indexación e recuperación
    4. Avaliación en RI
    5. RI na web. Un caso práctico: Google
    6. Aplicacións do procesamento da linguaxe natural á RI: a variación lingüística
  9. Extración de información (EI)
    1. Conceptos básicos
    2. Arquitectura dun sistema de EI
    3. Tarefas de EI
    4. Avaliación en EI
    5. Exemplos de sistemas de EI: FASTUS e outros
  10. Busca de respostas (BR)
    1. Conceptos básicos
    2. BR vs. RI/EI
    3. Arquitectura dun sistema de BR
    4. Procesamento da pregunta
    5. Recuperación e selección de documentos/pasaxes
    6. Extracción de resposta
    7. Avaliación en BR 
  11. Traducción automática (TA)
    1. Conceptos básicos e problemática
    2. Técnicas "clásicas"
    3. Técnicas estadísticas
    4. Aplicacións na RI interlingüe

Bibliografía Básica

Bibliografía Complementaria:

Na signatura I28 da biblioteca pódense atopar numerosos libros sobre Procesamento da Linguaxe Natural. Recoméndase aos alumnos que se dean unha volta por esa parte da biblioteca.

Transparencias:

Material complementario:



Tutorías

Véxase a páxina web da facultade


Prácticas

Enunciado da práctica do curso pasado (2008-09)


Evaluación


Enlaces de interese



Last modified: Mon Oct 19 12:21:26 CEST 2009