Text & Data Mining (TDM)

Analyser ou enrichir les documents scientifiques à l’aide d’outils automatiques (web services).

RAPIDO

Rendre Accessibles des Publications scientifiques Indexées et liées à des DOnnées certifiées

Lancement du projet RAPIDO

Son objectif : enrichir et mettre en relation les publications diffusées par Persée avec des sources externes ‑référentiels, données de recherche- afin de les inscrire dans un environnement scientifique étayé par des données ouvertes, au moyen d’un protocole automatisé.

Le dispositif envisagé s’appuie sur le savoir-faire de l’Inist dans le domaine du traitement automatisé de corpus ainsi que sur la consolidation d’un partenariat effectif entre Persée et l’Abes autour de l’enrichissement réciproque de leurs données via le référentiel IdRef.

La collaboration porte d’abord sur un corpus délimité de publications des Écoles françaises à l’étranger diffusées sur le portail de Persée.

Persée porte le projet RAPIDO lauréat du 2e appel à projets du Fonds national pour la science ouverte en faveur de la publication scientifique ouverte.

RAPIDO est le fruit d’un partenariat entre Persée, l’Inist, l’EfR, l’École française de Rome), l’EfA (École française d’Athènes) et l’Abes (Agence bibliographique
de l’enseignement supérieur).

TextMine

Lancement du Groupe de Travail de l’association EGC

Le but de ce groupe de travail est de réunir des chercheurs sur la thématique large de la fouille de textes. Ce groupe vise à offrir une occasion de rencontres pour les universitaires et les industriels, appartenant aux différentes communautés de l’intelligence artificielle, l’apprentissage automatique, le traitement automatique des langues, pour discuter des méthodes de fouille de textes au sens large et de leurs applications.

des services en TDM

Lancement de la nouvelle offre de services

Plusieurs web services ont été mis à disposition sur le site Objectif TDM.

Une offre de formations accompagne ces services.

Cuxac P., « L’IA et la fouille de textes à l’INIST : l’IA à portée de tous ? », Arabesques, 107 | 2022, 18-19.

Song K., Lamirel J.C., Cuxac P., Chen Y. : Tracking evolution of technology topics based on an improved DP-BMM approach based on topic labelling. 21st Collnet meeting, 10-12 Nov 2022, Bangkok, Thailand.

Bonvallot V., Parmentier F., Bourguignon L., Clauss I., Gregorio S., Le TDM pour tous grâce à des web services au sein de LODEX, outil libre de visualisation, Revue des Nouvelles Technologies de l’Information, Extraction et Gestion des Connaissances, RNTI-E-38, p. 445-452, 2022.