lematizador
1209 Visualizaciones

CG: nm

CA: Informática; Lingüística.

CT: El lematizador PALIC se empezó a desarrollar en febrero del 1995, pero fue en abril del 1997 cuando se hicieron las primeras pruebas en el corpus del IULA. En diciembre del 1999, la cantidad de palabras procesadas por PALIC en los documentos en español del corpus técnico del IULA es de casi seis millones.

F: http://www.upf.edu/pdi/dtf/teresa.cabre/docums/ca01lem.pdf (consulta: 4.06.2014)

DEF: Aplicación informática que elige convencionalmente una forma para remitir a ella todas las de su misma familia por razones de economía.

F: DRAE@; FCB.

N: 1. De «lema-» (del latín lemma, y este del griego λῆμμα, ‘tema o premisa’), + «-tiz» y el sufijo «-ador, ra» de «-dor, ra» (del latín -tor, -ōris), que forma adjetivos y sustantivos verbales. Aparece en las formas «-ador», «-edor», «-idor», según que el verbo base sea de la primera, segunda o tercera conjugación. Señala el agente. Organizador, ensordecedor, encubridor.
2. Nada en el CORDE pero sí en el CREA. La primera vez que aparece en un documento en español registrado por el CREA es en 1999. Autor: Efímero. Título: 99204076. Correo electrónico 1999. País: España. Tema: 08.Mensajes de correo electrónico.
3. Flexionador y lematizador de palabras en español – La aplicación informática que se presenta lematiza cualquier palabra del español al identificar su forma canónica, categoría gramatical y la flexión o derivación que la produce, y obtiene las formas correspondientes a partir de una forma canónica y de la flexión o derivación solicitada; tanto el reconocimiento como la generación operan sobre una misma estructura de datos, recorrerla en sentidos contrarios implica que la herramienta funcione en una u otra modalidad.
4. En los verbos, trata la conjugación simple y compuesta, los pronombres enclíticos, la flexión del participio como adjetivo verbal (género, número) y el diminutivo del gerundio. Con las formas no verbales, considera: género y número en los sustantivos, adjetivos, pronombres y artículos; heteronimia por cambio de sexo en los sustantivos; grado superlativo en los adjetivos y adverbios; adverbialización del superlativo en los adjetivos; derivación apreciativa en los sustantivos, adjetivos y adverbios; variantes gráficas en todas las categorías gramaticales; formas invariantes tales como preposiciones, conjunciones, exclamaciones, palabras de otros idiomas y locuciones o frases. Tanto en la lematización como en la generación se contempla la prefijación.
5. Permite el reconocimiento, la generación y la manipulación de las relaciones morfoléxicas a partir de cualquier palabra, incluye la recuperación de toda su información lexicogenética hasta llegar a una primitiva, la gestión y control de los afijos en el tratamiento de sus relaciones, así como la regularidad en la relación establecida. Proporciona una visión global del comportamiento y productividad de las palabras del español en los principales procesos de formación (sufijación, prefijación, parasíntesis, supresión, regresión, modificación-cero, apócope, metátesis y otros no clasificables que generan grafías alternativas).
6. A partir de 151 103 formas canónicas (incluye 14 859 nombres de personas y apellidos), se obtienen algo más de 4 900 000 formas flexionadas y derivadas (sin sumar la ampliación inherente a los prefijos y a los pronombres enclíticos) y se establecen unas 90 000 relaciones morfoléxicas. El sistema incluye todas las entradas del Diccionario de la Lengua Española de la Real Academia, del Diccionario General de la Lengua Española Vox, del Diccionario de Uso del Español de María Moliner, del Gran Diccionario de la Lengua Española de Larousse Planeta, del Diccionario de Uso del Español Actual Clave SM (1), del Diccionario de voces de uso actual dirigido por Manuel Alvar Ezquerra(2), del Gran Diccionario de Sinónimos y Antónimos de Espasa-Calpe y del Diccionario Ideológico de la Lengua Española de Julio Casares.

F: 1. DRAE@; FCB. 2. CREA (consulta: 9.11.2014). 3, 4, 5 y 6. http://www.gedlc.ulpgc.es/investigacion/scogeme02/lematiza.htm (consulta: 12.07.2014).

SIN:
F:

RC: informática, tradumática.

IL: Lematizador. Etiquetador morfológico. Analizador morfológico.

F: http://didactalia.net/comunidad/materialeducativo/recurso/lematizador-etiquetador-morfologico-analizador-mor/b774e609-80d3-4268-8cc2-ab7e66fe3bfe (consulta: 9.11.2014)