Un projet innove en matière d’IA pour créer «l’ADN du langage»
Les hallucinations de l’intelligence artificielle (IA) (génération de contenu faux et non fondé sur des données réelles) sont devenues un sujet à la mode en raison du déploiement d’importants modèles linguistiques tels que ChatGPT et Bard. Mais grâce à un projet de recherche financé par l’UE, les informaticiens peuvent envisager un traitement du langage naturel (TLN) parfait, indépendamment de la langue, tout en évitant le facteur de fausse information inhérent à l’IA. Le projet MOUSSE, ou Multilingual, Open-text Unified Syntax-independent SEmantics, a étudié de nouvelles approches visant à améliorer les capacités d’analyse sémantique multilingue, sans la lourde exigence d’annoter les données pour chaque langue différente. «Bien que puissants et impressionnants, les grands modèles linguistiques, tels que ChatGPT ou Bard, peinent encore à reproduire la confiance et le bon sens qui caractérisent les humains. MOUSSE jette les bases de cet ambitieux objectif. Il propose un énorme référentiel de connaissances multilingues qui peut être utilisé pour fonder les raisonnements et les résultats de ces modèles et lutter contre le phénomène problématique de l’hallucination», déclare Roberto Navigli, responsable du Sapienza Natural Language Processing Group et coordinateur du projet MOUSSE.
Utiliser le multilinguisme comme une ressource
Roberto Navigli décrit ce vaste référentiel développé par MOUSSE comme «l’ADN du langage», puisqu’il fournit la base pour construire des phrases pertinentes dans de nombreuses langues. Ceci grâce au principal résultat du projet: la capacité de créer l’équivalent informatique des représentations mentales que les humains se font des textes, mais indépendamment de la langue. Roberto Navigli explique: «L’ordinateur se fait une idée du sens d’une phrase en faisant abstraction de la langue et de la forme superficielle, c’est-à-dire des mots qui véhiculent ce sens.» Plus l’équipe utilise de langues pour exprimer la sémantique, plus elle peut corroborer la qualité de la représentation apprise. D’autre part, une fois qu’une représentation est obtenue à partir d’une phrase dans une langue donnée, des phrases dans d’autres langues peuvent être produites pour exprimer le même sens. «Cela s’apparente beaucoup à la traduction automatique, mais notre approche va plus loin: elle fournit une preuve formelle et structurée de ce que la machine a compris», explique Roberto Navigli. En tirant parti du multilinguisme, MOUSSE contribue à niveler le champ de la recherche en TLN pour toutes les langues de l’UE et des centaines d’autres. Le référentiel multilingue peut également être utile aux apprenants de langues pour améliorer leur vocabulaire et apprendre en se basant davantage sur le sens que sur les mots individuels.
Exploiter les outils d’IA pour de meilleurs résultats
Le projet MOUSSE a suivi quatre étapes principales pour développer ses capacités, à savoir la désambiguïsation du sens des mots, la mise en relation des entités, l’étiquetage des rôles sémantiques et l’analyse sémantique. Les résultats obtenus ont été possibles non seulement grâce à l’apprentissage profond, mais aussi en veillant à ce que le modèle et ses résultats soient interprétables et manipulables. En résumé, le projet a permis de relier les connaissances symboliques et les réseaux neuronaux, menant à une approche neuro-symbolique innovante. Selon Roberto Navigli, cela signifie que l’outil incarne le meilleur des deux mondes: haute performance et efficacité des modèles neuronaux, et interprétabilité, manipulabilité et indépendance par rapport à la langue de la partie symbolique. En substance, la connaissance symbolique est fournie par des graphes de connaissances multilingues comme BabelNet, un énorme dictionnaire encyclopédique multilingue qui est le fruit du projet MultiJEDI, également coordonné par Roberto Navigli. Les résultats de ces deux projets ont été conçus et pérennisés par son entreprise dérivée de l’université, Babelscape.
Mots‑clés
MOUSSE, IA, intelligence artificielle, hallucination de l’IA, grand modèle de langage, traitement du langage naturel, TLN, apprentissage automatique, apprentissage profond, désambiguïsation du sens des mots, étiquetage des rôles sémantiques, analyse sémantique, IA symbolique