reconocimiento automático del habla
981 Visualizaciones

CG: nm

CA: Informática; Telecomunicaciones; Inteligencia artificial.

CT: El proceso de reconocimiento automático del habla (RAH) dota a las máquinas de la capacidad de recibir mensajes orales. Tomando con entrada la señal acústica recogida por un micrófono, el proceso de reconocimiento automático del habla tiene como objetivo final descodificar el mensaje contenido en la onda acústica para realizar las acciones pertinentes. Para lograr este fin, un sistema de RAH necesitaría conjugar una gran cantidad de conocimientos acerca del sistema auditivo humano, sobre la estructura del lenguaje, la representación del significado de los mensajes y sobre todo el autoaprendizaje de la experiencia diaria.

F: http://physionet.cps.unizar.es/~eduardo/investigacion/voz/rah.html (consulta: 19.06.2014)

DEF: Proceso o tecnología que acepta como entrada una señal de voz natural y proporciona a la salida una versión codificada de lo que se ha dicho (palabra, instrucción, expresión, frase, etc.).

F: DEI

N: 1. Según el CREA, el término se recoge en el año 1990 en un artículo de la revista Cambio 16.
2. Aunque han existido a lo largo de la corta historia del reconocimiento automático del habla distintos enfoques, los más utilizados y que han proporcionado los mejores resultados han sido los probabilísticos, basados en la Teoría de la Decisión de Bayes, la Teoría de la Información y las Técnicas de Comparación de Patrones y de Programación Dinámica (BEL65)(NEY93)(NEY90).
Dentro de este enfoque, por “sistema de reconocimiento automático del habla“ entendemos un sistema de cierta complejidad capaz de descodificar los sonidos u otra información de nivel superior que forman parte de una determinada señal de habla. Dicha descodificación puede realizarse de diferentes formas, utilizando diferentes técnicas y con unos determinados requisitos de partida para la señal de habla a decodificar. En el fondo, se trata de ser capaces de generar un conjunto de patrones (asociados a partes de habla) que puedan ser comparados con la señal acústica de entrada (por reconocer) devolviendo la secuencia de estos patrones que con mayorprobabilidad «representan» a la misma.
El proceso de reconocimiento automático de habla tiene como función obtener la secuencia de palabras asociada a la frase en lenguaje natural (LN) de entrada. La frase es pronunciada por el locutor de forma continua, es decir, sin pausas entre las palabras, y a menudo, tiene problemas de agramaticalidad, incluye elementos propios del habla espontánea como son las interjecciones, falsos comienzos, repeticiones, etc. El sistema de reconocimiento de habla, por su parte, presenta problemas de cobertura léxica y sintáctica (estructural). Por todo ello, la tarea del sistema de reconocimiento de habla no es sencilla, y además, es costosa, tanto en memoria como en cálculo.

F: 1. CREA (consulta: 16.11.2014); LBR. 2. http://elies.rediris.es/elies12/cap241.htm (consulta: 14.11.2014).

SIN: reconocimiento automático de la voz

F: DEI

RC: informática, inteligencia artificial.

IL: Reconocimiento automático del habla.

F: http://mit.ocw.universia.net/6.345/OcwWeb/Electrical-Engineering-and-Computer-Science/6-345Automatic-Speech-RecognitionSpring2003/CourseHome/