El equipo del DRIT participa en el reto SEM-EVAL 2022

Compartir por correo electrónico
Participante de SEM-EVAL

SemEval es una serie de talleres internacionales de investigación sobre el procesamiento del lenguaje natural (PLN) cuya misión es avanzar en el estado actual del arte del análisis semántico y ayudar a crear conjuntos de datos anotados de alta calidad en una serie de problemas cada vez más desafiantes en la semántica del lenguaje natural. El taller de cada año incluye una colección de tareas compartidas en las que se presentan y comparan sistemas de análisis semántico computacional diseñados por diferentes equipos.
La 16ª edición de SemEval cuenta con 12 TAREAS sobre una serie de temas, entre los que se incluyen tareas de detección e incrustación de idiomáticas, detección de sarcasmo, similitud de noticias multilingües y vinculación de símbolos matemáticos con sus descripciones. Varias tareas son multilingües y otras requieren enfoques multimodales.

Los miembros de nuestro equipo eligen dos tareas de la lista de 12 tareas:

  • Tarea 1: CODWOE - COmparación de diccionarios e incrustaciones de palabras: La tarea compartida CODWOE invita a comparar dos tipos de descripciones semánticas: glosas de diccionario y representaciones de incrustación de palabras. ¿Son equivalentes estos dos tipos de representación? ¿Podemos generar una a partir de la otra?
  • Tarea 8: Similitud de los artículos de noticias multilingües: La diferencia con la similitud de los documentos tal y como se concibe habitualmente: En este caso, nos interesan los acontecimientos del mundo real de los que tratan los artículos de noticias, no su estilo de redacción, el giro político, el tono o cualquier otra "decisión de diseño" más subjetiva impuesta por un medio de comunicación. Las principales subdimensiones de similitud son la geolocalización, el tiempo, las entidades compartidas y las narrativas compartidas. Esto permite evaluar hasta qué punto los medios escriben sobre "las mismas cosas".

Eligen esas tareas porque están directamente relacionadas con varios encuentros problemáticos en el DRIT sobre la representación semántica de elementos textuales.

El calendario es el siguiente:

  • 10 de enero de 2022: Inicio de la evaluación
  • 31 de enero de 2022: Fin de la evaluación
  • 23 de febrero de 2022: Presentación de artículos científicos
  • 31 de marzo de 2022: Notificación a los autores

Si el equipo es seleccionado, tendrá la oportunidad de participar en el NAACL (Conferencia anual de la sección norteamericana de la Asociación de Lingüística Computacional) para el verano de 2022 en Seattle, Washington. Una gran oportunidad para conocer a otros científicos de todo el mundo e intercambiar conocimientos.

Los miembros de nuestro equipo que participan en el reto son Mokhtar Boumedyen BILLAMI, Christophe BORTOLASO, Sébastien DUFOUR, Camille GOSSET, Julien BRETON, Mehdi KANDI, Youssef MILOUDI, Lina NICOLAIEFFKarim BOUTAMINE y Nihed BENDAHMAN.

Más ...

Scroll al inicio