exploration de données
494 Visualisations

CG : nf

CT : La tension entre protection et exploitation de la création est un équilibre dynamique, c’est-à-dire instable, donc en définition permanente. L’exploration de données (« Text and Data mining ») en donne encore une illustration, tout en renouvelant le genre. Comme bien souvent avec le numérique, le centre de gravité s’est déplacé. La nouveauté est là. L’exploration de données utilise, exploite, l’oeuvre, non pour la reproduire ou la représenter, au sens du droit d’auteur, mais pour produire de la connaissance. De cette connaissance pourront naître de nouvelles connaissances, de nouveaux produits et services à
valeur ajoutée.
La revue de presse, manuelle puis automatisée, suggère l’exploration de données mais elle n’en est pas. Certes elle se réalise par une démarche similaire d’identification de multiples sources puis leur fouille afin d’en extraire de l’information. Toutefois cette information contient des « extraits » de l’oeuvre, que ceux-ci relèvent ou non des exceptions de citation ou de revue de presse. Il y a emprunt à l’oeuvre par l’extraction et la restitution de l’objet même de la protection du droit d’auteur : la forme originale.
Le résultat de l’exploration de données ne fait pas d’emprunt à la forme originale de l’oeuvre.
Il n’a pas pour objet, sauf exception, à la restituer, pas plus que le contenu des bases de données. De l’une ou de l’autre, il ne dégage que de la « connaissance », du « sens », par l’analyse de l’objet prédéfini ou aléatoire opérée grâce à des algorithmes élaborés pour combiner et traiter une multitude de sources et de problématiques en fonction de la finalité recherchée.

S : http://www.culturecommunication.gouv.fr/Politiques-ministerielles/Propriete-litteraire-et-artistique/Conseil-superieur-de-la-propriete-litteraire-et-artistique/Travaux-du-CSPLA/Missions/Mission-du-CSPLA-relative-au-text-and-data-mining-exploration-de-donnees (consulté le 24.12.2014)

N : 1. exploration (nf) : XVIe siècle ; rare avant le XVIIIe siècle. Emprunté du latin exploratio, « observation, examen ».
de (prép) : IXe siècle. Du latin classique de, préposition qui marquait la séparation, l’éloignement, l’union, l’association, la partition, la conséquence, l’origine, et qui a servi, dès la période classique, dans la langue familière, à renforcer les formes d’ablatif, puis a concurrencé, en bas latin, le génitif partitif et de possession.
données (nfpl) : donnée n.f., XIIIe siècle, au sens de « distribution, aumône » ; XVIIIe siècle, comme terme de mathématiques. Participe passé féminin substantivé de donner au sens de « indiquer, dire ». INFORM. Représentation d’une information sous une forme conventionnelle adaptée à son exploitation. Le traitement automatique des données. Une banque, une base de données.
2. Informatique : Processus de recherche dans un ensemble de données destiné à détecter des corrélations cachées ou des informations nouvelles.
3. Informatique > Intelligence artificielle : Technique de recherche et d’analyse de données qui permet de dénicher des tendances ou des corrélations cachées parmi des masses de données, ou encore de détecter des informations stratégiques ou de découvrir de nouvelles connaissances, en s’appuyant sur des méthodes de traitement statistique.
4. L’exploration de données est surtout utilisée, dans le contexte de l’informatique décisionnelle, en association avec l’entreposage de données, l’analyse multidimensionnelle et l’utilisation d’agents intelligents. Elle permet, par exemple, de déterminer quels sont les critères qui décident de l’achat d’un produit, quelle est la source des défauts détectés en fabrication ou quelle tranche de population un publipostage doit viser.
5. En France, le terme « exploration de données » a été officialisé par la Commission générale de terminologie et de néologie, en 2003.
L’emploi du terme « orpaillage » est métaphorique dans la mesure où il est fréquent de comparer les données détenues par les entreprises à des mines d’or. L’orpaillage désigne, en effet, l’activité de l’ouvrier qui recueille par lavage les paillettes d’or dans les fleuves ou les terres aurifères.
6. L’Extraction de Connaissances à partir de Données (ECD), communément appelée DATA MINING, est un domaine aujourd’hui très en vogue, pour ne pas dire à la mode. On la définit comme « un processus non-trivial d’identification de structures inconnues, valides et potentiellement exploitables dans les bases de données (Fayyad, 1996) ». Cette définition est une des premières qui traite explicitement de l’ECD (Knowledge Discovery in Databases en anglais), par la suite plusieurs tentatives de re-définition sont apparues pour mieux préciser le domaine mais aucune ne s’est réellement imposée. En tous les cas, à la lecture des différents documents qui traitent de l’ECD, on peut se dire que, finalement, cela fait plus de 30 ans qu’on le pratique avec ce qu’on appelle l’analyse de données et les statistiques exploratoires.

S : 1. DAF (consulté le 24.12.2014) ; FCB. 2. FT – https://lc.cx/i2wj (consulté le 24.12.2014) ; GDT – https://lc.cx/i23g (consulté le 24.12.2014). 3 à 5. GDT – https://lc.cx/i23g (consulté le 24.12.2014). 6. http://chirouble.univ-lyon2.fr/~ricco/data-mining/ (consulté le 24.12.2014).

SYN : 1. prospection de données, orpaillage. 2. forage de données. 3. fouille de données.

S : 1. GDT – https://lc.cx/i23g (consulté le 24.12.2014). 2. TERMIUM PLUS – https://lc.cx/i2UC (consulté le 24.12.2014); GDT – https://lc.cx/i23g (consulté le 24.12.2014). 3. http://cybertim.timone.univ-mrs.fr/enseignement/doc-enseignement/informatique/introdatawarehouse/docpeda_fichier (consulté le 24.12.2014) ; GDT – https://lc.cx/i23g (consulté le 24.12.2014).

RC : informatique, intelligence artificielle.