catégorisation textuelle
615 Visualisations

CG : nf

CT : Les problèmes de la catégorisation textuelle :entre fondements théoriques et fondements structurels : La linguistique textuelle n’a cessé de se pencher sur le problème de catégorisation des textes sans parvenir à ce jour à l’identiication de critères communs.
En effet, à des ins d’enseignement, et face à l’hétérogénéité constitutive de toute production textuelle, la nécessité de classer les textes selon la forme, leur composition, leur l’organisation et leur structuration, s’impose impérativement. C’est pourquoi notre article, issu de travaux de recherches en linguistique textuelle, se veut un balayage sur certains aspects théoriques et sur leurs soubassements référentiels, concilié aux aspects structurels permettant une réelle typologisation textuelle.

S : http://halshs.archives-ouvertes.fr/docs/00/91/98/23/PDF/benali.pdf (consulté le 13.06.2014)

N : La catégorisation des textes soulève en effet des problèmes délicats liés à la nature des données textuelles dont la structuration n’est pas évidente (on parle données non structurées et semi-structurées). Des méthodes pour mesurer la similarité entre les textes ont néanmoins été établies afin de procéder à du clustering de documents et notamment de pages web.

S : http://www.crim.fr/node/163 (consulté le 13.06.2014)

SYN : catégorisation des textes

S : http://www.crim.fr/node/163 (consulté le 13.06.2014)

RC : traitement automatique du langage naturel