Curso de Introducción a Tecnologías del Habla (24 horas)
Los Grupos de Investigación en Ciencias Fonéticas www.ing.ula.ve/~hourcade/fonetica/, asociado a las Facultades de Humanidades e Ingeniería, y en Procesamiento de Voz www.ing.ula.ve/~hourcade/pdvula/, asociado a las Facultades de Ingeniería y FACES, de la Universidad de los Andes, invitan a este curso en Tecnologías del Habla.
Audiencia:
Los Cursos están dirigidos a estudiantes de postgrado y profesionales de Lingüística e Ingeniería
Patrocinantes:
Universidad de los Andes:
Consejo de Estudios de Postgrado,
Maestría en Lingüística,
Doctorado en Lingüística,
Postgrado en Computación,
Postgrado en Control y Automatización,
Postgrado en Automatización e Instrumentación,
Postgrado en Ingeniería Biomédica,
Postgrado en Simulación y Modelaje,
Postgrado en Estadística Aplicada y Computación.
Universidad Politécnica de Cataluña:
Departamento de Teoría de la Señal y Comunicaciones (http://gps-tsc.upc.es/veu/veu_home.php3)
Universidad de Granada
Departamento de Electrónica y Tecnología de Computadoras
Universidad de Vigo
Departamento de Teoría de la Señal y Comunicaciones
Agencia Española de Cooperación Iberoamericana
Tópicos:
Tema 1: Tecnologías del habla (2 horas)
- Introducción
- Tecnologías
- Aplicaciones
- Historia
- El reconocimiento del habla
- La síntesis de voz
Tema 2: La señal de voz (2 horas)
- Introducción. Un ejemplo
- El aparato fonador. Fonética acústica
- Modelo de preoducción
- Parámetros fundamentales
- Percepción
- Parametrización
Tema 3: Representación de la señal de voz. (2 horas)
- Objetivos
- Banco de filtros.
- Medidas de distancia
- Filtrado temporal
- Agrupación de características
- Cuantificación vectorial
- Gaussianas
- Evolución temporal de los parámetros
- Esquema general de un sistema de reconocimiento. Valores típicos
Tema 4: Modelos Ocultos de Markov. (2 horas)
- Introducción. Necesidad del modelado
- Modelos Ocultos de Markov
- Definición
- Generación de una secuencia de voz
- Entrenamiento
- Reconocimiento
- Secuencia de estados
- Tipos de modelos
- Inicialización
Tema 5: Reconocimiento de palabras aisladas (2 horas)
- Esquema de un sistema de reconocimiento de palabras aisladas
- Verificación
- Word spotting
- Entrenamiento discriminativo
Tema 6: Modelado acústico fonético (4 horas)
- Unidades fonéticas
- Transcripción fonética
- Unidades fonéticas en un sistema de reconocimiento
- Entrenamiento de los Modelos Ocultos de Markov:
- K-means
- Embebido
- Discriminativo
- Reestimación del Cuantificador
- Ejemplos
Tema 7: Modelado del lenguaje (2 horas)
- Gramática de estados finitos: algoritmo de un paso.
- La jerarquía de Chomsky
- Regla de Bayes.
N-gramas
Estimación
X-gramas
- Organización de la búsqueda
Limitación de memoria
Limitación en tiempo
Tema 8: Síntesis de voz (4 horas)
- Introducción
- Métodos clásicos de síntesis
- Sistemas de respuesta oral
- Sistemas de conversión texto-voz
- Unidades de síntesis
- Preprocesado de texto
- Procesado lingüístico
- Procesado suprasegmental y segmental
- Síntesis mediante técnicas PSOLA
Tema 9: Bases de datos (2 horas)
- Tipos de bases de datos
- Bases de datos orales
- Diseño de bases de datos fonéticas
- Ambientes de grabación
- Proyecto SALA
Tema 10: Aplicaciones y líneas futuras (2 horas)
- Aplicaciones del reconocimiento del habla.
- Sistemas de diálogo
- Problemática de la implementación en tiempo real
- Algoritmos simplificados, Velocidad, Robustez
Expositores:
Dr. Antonio Bonafonte, Universidad Politécnica de Cataluña
Lugar y Fecha:
Lugar:
Salón de Postgrado de FACES
Fecha de Realización:
Del 1º al 5 de Julio de 2002
Horario:
Lunes a Viernes de 9 a 11 am. y de 3 a 6 pm.
Información e Inscripciones:
La inscripción puede ser en persona en el Departamento de Electrónica y Comunicaciones, Facultad de Ingenieria, Avda. Tulio Febres Cordero, Mérida, o alternativamente en cualquier de los Postgrados patrocinadores de los cursos; o también puede ser a distancia por medio de correo electrónico. Los depósitos deberán hacerse en efectivo a la cuenta “SALA-CDCHT” del Banco Mercantil #1065-26640-5, y se debe enviar el fax del depósito junto a la planilla de inscripción al número de fax (0274) 2402890. Las personas deberán inscribirse antes del inicio del curso.
Costo:
Bs. 100.000 profesionales
Bs. 70.000 estudiantes
Información de Contacto:
Manuel Rodríguez Hourcadette
E-mail: hourcade@ing.ula.ve
hourcadette@hotmail.com
Teléfonos: 0274-2402907, 2403815;
Fax: 0274-2402980
Mas información...