AXES DE RECHERCHE

Thème 1 : Intégration sémantique de Réseaux d'Information hétérogènes et Interopérabilité (IRI)

Responsable : Myriam Lamolle

Grâce aux nouvelles technologies liées au web, les échanges de données entre utilisateurs, entre utilisateurs et applications, ou entre applications sont de plus en plus conséquents. Notamment, l'arrivée du Web 3.0 et des données ouvertes ou Linked Open Data (LOD) ainsi que la profusion de données massives provenant de systèmes d'informations, de capteurs, de satellites, etc. a induit une augmentation de l'hétérogénéité des informations à gérer.

D'autre part, de plus en plus d'informations sont échangées par des collaborateurs via les nouvelles plateformes de collaboration. Ceci induit un nouveau type d'intégration à savoir l'intégration de données "ambiantes" (par exemple, informations échangées par courriel à intégrer dans le S.I.). Une nouvelle vision des concepts d'intégration et d'interopérabilité est nécessaire. La collecte des informations pertinentes devient encore plus difficile puisque les données proviennent de sources encore plus hétérogènes (bases de données réseaux sociaux, données non structurées, Open Data, Big Data). Les données représentant le même concept sont structurées totalement différemment selon le système de stockage.

Cependant, il est indispensable de retrouver la sémantique attachée à ces données malgré leurs structurations différentes. Pour faciliter l'interopérabilité entre les différents systèmes d'information et leurs applications, nous nous proposons de réduire "la distance" les séparant par :

  • l'appréhension de leurs modèles et leurs métamodèles pour en obtenir une vue unifiée, (approche matérielle ou approche virtualisée selon le cas),
  • l'amélioration des techniques d'alignement de ces modèles et de leurs données,
  • la mise en place de règles de transformation automatique de modèles.

Nous chercherons à déterminer à partir des différents schémas ou des données collectées, des ontologies.

Actuellement, nous affinons notre principe d'intégration sémantique de réseaux d'information dans divers projets par des approches provenant du Web Sémantique, du Big Data/Deep Learning ou par hybridation de ces deux champs :

  • projet "ELKER (Enhancing Link Keys: Extraction and Reasoning), financement ANR" : dans le contexte des données ouvertes et (LOD), une partie de la valeur ajoutée de ces données réside dans les liens identifiant la même entité dans différents jeux de données. Par exemple, ils peuvent identifier les mêmes livres et articles dans différentes sources de données bibliographiques. Les liens permettent d'exploiter conjointement le contenu des sources de données et de faire des inférences entre les ensembles de données. Par conséquent, trouver la manifestation d'une même entité à travers plusieurs ensembles de données est une tâche cruciale pour les données liées. L'objectif d'ELKER est d'étendre les fondements et les algorithmes des clés de liage de deux manières complémentaires : extraction automatique des clés de liage à partir des jeux de données et raisonnement avec ces clés. Voir le détail ici.

    Ce projet est en collaboration avec l'INRIA Grenoble et Nancy, le LIG. Il a donné lieu à un contrat de post-doctorat et une thèse encadré par C. Le Duc.

  • projet "ASADERA (Automatic Summarization at the All-Digital ERA), financement ANR JCJC" : ce projet vise à étudier de nouvelles formes de résumé automatique afin de répondre à de nouvelles problématiques introduites par la mondialisation de l’information numérique ou numérisée, et le passage au numérique de documents de spécialité, notamment dans les systèmes d’information. Voir le détail ici.

    Ce projet a donné lieu à une thèse par Valentin Nyzam, encadré par A. Bossard

  • projet "Learning Café, financement FUI15 - Label Cap'Digital" : ce projet consiste en une plateforme d'apprentissage au travers de ressources pédagogiques multimédia pour les métiers manuels principalement. Dans ce cadre, nous modélisons 3 ontologies (profil-utilisateurs, formation, vidéos) et leurs alignements. La gestion de ces ontologies à long terme implique une révision dynamique de ces ontologies pour garantir leurs cohérences. Par exemple, si un concept est rajouté dans l'ontologie des formations, quel est son impact sur le réseau d'ontologies inter-connectées. D'autre part, il faut individualiser le parcours des formations par un moteur de scénarisation dynamique qui prend en entrée les trois ontologies pour trouver le parcours le plus pertinent pour un utilisateur donnée.

    Ce projet a donné lieu à deux thèses :

    • Révision dynamique d'ontologies par Thinh Dong, encadré par C. Le Duc et M. Lamolle
    • Moteur de scénarisation par Azziz Hangour, encadré par G. Delmas et M. Lamolle

     

  • projet "SONAR, financement FUI15 - Label Cap'Digital" : (SOurcing aNd Automated Recruitment), vise à donner au marché de l'emploi des outils automatisés pour mettre en relation efficacement – c'est-à-dire avec de bons résultats et pour le prix adéquat – des candidats avec des recruteurs. Il fera pour cela appel à des technologies sémantiques innovantes, appliquées sur une base unique en France de plus de 10 millions d'annonces, au travers d’une interface logicielle en mode SaaS (Software as a Service).

    Le SONAR cherche à concevoir des outils intelligents sur le marché de l’emploi, un réel conseil en recrutement automatisé pour permettre aux recruteurs :

    • de choisir les canaux les plus pertinents pour leur stratégie de recrutement (diffusion d’annonces, recherche de CV, campagne de cooptation…) ;
    • d’obtenir une proposition d’annonce rédigée automatiquement, adaptée au profil ciblé ;
    • d’obtenir des profils pertinents correspondant à leur recherche, issus des CVthèques internet et réseaux sociaux.

     

    Ces outils seront déployés dans les grands groupes, dont une majorité sont déjà utilisateurs des solutions Multiposting et Work4 Labs, ainsi que dans les PME.

  • projet "Spiritionary" : le travail collaboratif devient incontournable pour les chercheurs quel que soit le domaine dans lequel ils évoluent. La documentation dont ils ont besoin est indispensable et est bien souvent très conséquente. Dans ce projet, il s'agit de mettre à disposition une encyclopédie (l'encyclopédie de la spiritualité) sous forme d'ontologie (servant de référence) pour faciliter l'utilisation des entrées déjà définies. Puis, dans un second temps, notre infrastructure doit permettre aux usagers de construire leurs propres ontologies au fur et à mesure de leur appropriation de l'ontologie de référence, de collaborer avec d'autres chercheurs sur la rédaction de nouvelles entrées, de trouver des chercheurs travaillant ou ayant déjà travaillés sur des entrées identiques ou connexes. Toute nouvelle entrée peut être soumise à des experts pour être validée en vue d'une intégration dans l'ontologie de référence.

    Ce projet est en collaboration avec R. Burnet de l'UC Louvain, A. Muñoz de IUTE Mérida (Vénezuela) et les Éditions Beauchesne.

 

Thème 2 : Hypermédia adaptatif

Responsable : Jean-Hugues Réty

  • projet "MICAME" : ce projet a pour but d'intégrer des hypermédias adaptatif en relation avec des agents. conversationnels émotionnels dans le domaine éducatif.

    Ce projet a donné lieu à une soutenance de thèse en juillet 2008 par Mohamedade Farouk.

  • projet "MUSE" : il s'agit de modéliser un hypertexte collaboratif dans le domaine de la littérature pour le web.