EGC 2022

La conférence EGC (Extraction et Gestion des Connaissances) est un événement annuel réunissant les chercheurs et les praticiens de la science des données et des domaines de la connaissance (par exemple : apprentissage automatique, web sémantique et données ouvertes, etc.) Cette année, la 22e édition s'est tenue à Blois (France) du 24 au 28 janvier.
L'événement a été organisé avec deux journées scolaires sur le thème principal : L'homme dans la boucle de l'exploration et de l'apprentissage des données pour les étudiants et les doctorants désireux d'enrichir leurs connaissances dans le domaine, et trois jours de conférences.

Ikram Boukharouba, Camille Gosset et Nicolas Ringuet, doctorants à la DRIT, ont participé à l'événement pour représenter Berger-Levrault et ont pris part aux journées scolaires et aux journées de conférences.

Les journées scolaires étaient composées de tutoriels d'introduction autour de plusieurs problématiques, de sujets scolaires et de nouvelles techniques :

  1. "Comment modéliser une tâche de clustering afin d'obtenir un résultat le plus proche possible de ce que souhaite l'utilisateur ?". Présenté par le Professeur Christel Vrain de l'Université d'Orléans.
  2. Dans la continuité, le Professeur Bruno Crémilleux de l'Université Caen Normandie a abordé le problème de la recherche extensive de motifs dans l'exploration de données et l'utilité de trouver des motifs basés sur des contraintes pour être centrés sur l'utilisateur.
  3. Vanessa Murdock, directrice de la recherche en sciences appliquées pour le produit "Alexa" d'Amazon, a expliqué comment Amazon détecte les "contextes offensifs" pour recommander un produit aux clients.
  4. Patrick Marcel et Veronika Peralta - (LIFAT, Université de Tours) à propos de "L'analyse exploratoire des données : de l'insight au storytelling".
  5. Sarah Cohen-Boulakia (LISN, Université Paris-Saclay) a expliqué l'importance du problème de la reproductibilité dans la recherche à travers sa présentation "Reproducibility of bioinformatics data analysis pipelines".
  6. Sihem Amer-Yahia (LIG, Université Grenoble Alpes) - "Les humains sur les marchés du travail en ligne".

Pendant les jours de la conférence, les personnes qui ont publié ont présenté leurs travaux.
Camille Gosset a présenté sa publication : Création et validation de représentations vectorielles pour les relations lexicosémantiques : application à l'identification/classification de relations à partir d'un corpus d'affaires. Camille Gosset, Mokhtar Boumedyen Billami, Mathieu Lafourcade, Christophe Bortolaso et Mustapha Derras. Une étude comparative sur les représentations vectorielles pour les relations lexicosémantiques sur deux systèmes : (1) le nôtre, où les relations vectorielles d'enchâssement sont déduites des termes vectoriels d'enchâssement, et (2) le système RELATIF (.Camacho-Collados et al., 2019), un système de pointe où les relations entre les vecteurs d'intégration sont apprises. Nous proposons des vecteurs d'intégration pour des termes clés (plusieurs mots et expressions) et non pour un seul mot. Si vous voulez en savoir plus, suivez ce lien.
Comme souvent, l'apprentissage automatique a été abordé selon deux axes : les méthodes supervisées et les méthodes non supervisées.
Un domaine présenté concernait les données textuelles, domaine auquel Berger-Levrault s'intéresse de plus en plus. Il s'agit de mettre en place un système permettant de traiter des textes présentés dans un style différent (par exemple des tweets, des textes juridiques, etc.).
Les autres principaux domaines explorés étaient les données temporelles (comment traiter les données qui nous parviennent au fil du temps), l'interaction et la multimodalité (comment reconnaître automatiquement les émotions), et la gestion de l'information. Applications émergentes de l'IA (par exemple : Bitcoin).
Les discours d'ouverture ont été présentés par :

  • Siham Amer-Yahia : Directeur de recherche au CNRS, Grenoble.
  • Vanessa Murdock : Directrice de la recherche en sciences appliquées pour Amazon
  • Sonia Ben Mokhtar : Directrice de recherche au CNRS, Laboratoire LIRIS
  • Sarah Cohen-Boulakia : Professeur à l'Université Paris-Saclay
  • Frédérique Segond : Directrice de la mission Défense et Sécurité d'Inria et chercheuse associée à l'équipe ERTIM de l'Institut national des langues et cultures orientales.
  • Maya Ramanath : Professeur associé, Département d'informatique et d'ingénierie, IIT Delhi

Comme vous pouvez le constater, tous les invités de la conférence étaient des femmes, alors que l'inclusion et l'égalité des sexes sont des sujets de société d'actualité. Une table ronde a également été organisée sur le sujet : "Sommes-nous diversifiés et inclusifs", explorant comment nous pouvons être plus diversifiés et inclusifs.

Plus ...

Retour haut de page