etiquetador
879 Visualizaciones

CG: nm

CA: Informática; Tradumática – Herramientas de traducción asistida por ordenador.

CT: Las características y prestaciones de cada programa, aun perteneciendo aun mismo tipo, pueden variar bastante. Además, algunos tipos de herramientas están en una fase de desarrollo avanzado (por ejemplo, las bases de datos terminológicos), mientras que otras están en sus inicios o no disponen de interfaz cómoda para el usuario común (por ejemplo, el uso de etiquetadores exige manejar instrucciones de un lenguaje de programación). Algunos programas están diseñados para realizar un conjunto de tareas complejas con gran flexibilidad, pero a su vez esto exige que el usuario sea capaz de manejar con destreza todas sus funciones. En otros casos, los programas realizan tareas sencillas y con poca flexibilidad, por lo que no conlleva dificultades para el usuario, pero el beneficio que obtiene también es menor. Así, por ejemplo, una base, de datos terminológicos que admita la posibilidad de múltiples tipos de campos o múltiples formatos de exportación definibles por el usuario estaría en el primer grupo. En cambio, una aplicación que convierte un texto «html» en un texto plano «txt» con solo pinchar un botón estará en el segundo grupo.

F: http://tecnolettra.uji.es/pubs/Alcina_03_Terminologia_y_Traduccion.pdf (consulta: 31.05.2014)

DEF: Programa que procesa, de forma automática, la asignación de una etiqueta gramatical a cada una de las palabras de un texto segun su categoría léxica.

F: http://www.dc.uba.ar/inv/tesis/licenciatura/2013/rodriguez.pdf (consulta: 4.12.2014); FCB.

N: 1. Del sustantivo «etiqueta» y este del francés étiquette + sufijo -ador, ra, V. -dor (del latín -tor, -ōris), forma adjetivos y sustantivos verbales. Aparece en las formas -ador, -edor, -idor, según que el verbo base sea de la primera, segunda o tercera conjugación. Señala el agente.
Dicho término no aparece registrado por el DRAE ni los corpus CORDE y CREA.
Es un calco del inglés tagger.
2. La mayoría de los etiquetadores actuales utilizan modelos estadísticos que se generan a partir de
un texto anotado previamente (corpus de entrenamiento).
El rendimiento del etiquetador es fuertemente dependiente del corpus de entrenamiento utilizado.
Vale observar que la generacion de corpus de entrenamiento es una tarea costosa, por lo tanto la cantidad y calidad de los mismos es limitada.
3. Existen diferentes tipos de aplicaciones útiles para la labor terminográfica, entre los cuales podemos citar las
aplicaciones que realizan análisis gramaticales del corpus, como son los Part-of-Speech taggers (POS taggers o etiquetador gramatical), cuya finalidad consiste en asignar a cada palabra de un texto su categoría gramatical, es decir, indicar si se trata de un sustantivo, un adjetivo, un verbo auxiliar, etc. Es el tipo de anotación más básica y, a menudo, es una fase previa a la extracción terminológica, como veremos más abajo, y para distinguir homógrafos.
4. Existen numerosos etiquetadores gramaticales disponibles en la actualidad, pero uno de los más utilizados en los proyectos de Lingüística Computacional es TreeTagger.

F: 1. DRAE@; FCB. 2. http://www.dc.uba.ar/inv/tesis/licenciatura/2013/rodriguez.pdf (consulta: 4.12.2014); (consulta: 4.12.2014). 3 y 4. http://riuma.uma.es/xmlui/bitstream/handle/10630/4847/TD%20de%20Isabel%20Dur%C3%A1n%20Mu%C3%B1oz.pdf?sequence=1 (consulta: 4.12.2014).

SIN:
F:

RC: etiqueta, informática, tradumática.

IL:
F: