Votre partenaire privilégié pour la recherche contractuelle bilatérale

Cognition & Langage

Définition & Concept

Le langage peut se définir comme la capacité à exprimer une pensée, se traduisant par l’expression de différents signes, et ce, sous plusieurs formes (signaux vocaux, signes graphiques, gestes…). Le langage, et donc cette transmission de signaux, est ici appréhendé comme un système de communication possédant une sémantique, éventuellement une syntaxe, pouvant alors être perçus et réceptionnés, par exemple lors de communication entre humains.

Une part des travaux menés à l’Institut Carnot vise à prendre en considération des processus cognitifs, et plus précisément les processus langagiers humains, dans les systèmes de traitement automatique du langage pour améliorer l’interaction humain-machine (traitement de la parole, du langage et des langues, apprentissage, multimodalité, gestualité, multilinguisme, traduction assistée, affects, identification de la langue et du locuteur, agents conversationnels).

Champs d’applications

Les projets menés au travers de l’Institut Carnot, fédérant des laboratoires de recherche internationalement reconnus en traitement du langage, s’articulent autour de différents axes de recherche, avec des champs d’application divers, que nous présentons succinctement.

Le traitement automatique des langues (TAL) est une thématique de recherche multidisciplinaire intégrant des domaines tels que l’informatique, la linguistique, les sciences de la cognition ou encore l’intelligence artificielle. Longtemps étudiés séparément, de nombreux travaux cherchent désormais à tirer profit des avancées scientifiques obtenues dans chacune de ces grands domaines de recherche. Regroupant de très vastes applications, le TAL vise à proposer des approches, solutions et outils innovants pour résoudre des problèmes et répondre aux besoins applicatifs liés au langage (reconnaissance automatique de la parole, dialogue homme-machine, résumé automatique…). Le spectre des applications visées et des outils développés dans le cadre du TAL est très large, de la compréhension du langage naturel (recherche sémantique, analyse de sentiments, ironie…), à l’interaction en langage naturel (synthèse de la parole, agents conversationnels…), en passant par des tâches concernant l’étude de la voix (voix pathologiques, analyses prosodiques, reconnaissance et vérification du locuteur…) ou la génération du langage (traduction automatique, systèmes de question-réponse…).

La prise en compte de l’aspect cognitif, et notamment son implication dans le processus de réalisation du langage, fait partie des préoccupations des acteurs scientifiques en traitement des langues de l’Institut Cognition. Cet aspect Cognition & Langage est d’autant plus important depuis quelques années, avec les avancées scientifiques et technologiques autour de l’apprentissage profond (deep learning) et l’accès à des très grandes masses de données (big data), ayant permis des avancées significatives sur de nombreuses problématiques de recherche. Ces avancées ont cependant amené de nouvelles questions que les travaux en sciences cognitives pourraient aider à y répondre, sur l’amélioration des méthodes mais également sur la compréhension, l’analyse et l’explicabilité de ces modèles statistiques.

Enfin, l’étude, la compréhension, et la proposition d’outils automatiques pour le traitement de différentes modalités (gestes, voix, vidéo…) étant maintenant arrivé à un niveau de maturité et d’industrialisation suffisants, de nombreuses recherches sont actuellement entreprises sous l’angle de la multimodalité, où les divers modes d’expression sont alors utilisés conjointement pour traiter des tâches particulières, permettant une complémentarité des informations extraites et plus grande robustesse des systèmes.

Exemples de projets

Cet axe a donné lieu à de nombreux projets de recherche collaboratifs dans les domaines du langage et de la cognition, avec des avancées significatives dans les thématiques développées (représentation vocale, interaction homme-machine, modélisation sémantique, fouille de données web – bigdata…). Parmi ces projets, nous pouvons citer les projets ANR ContentCheck (vérification de faits), TheVoice (design de voix pour l’industrie créative), SOMBRERO (téléopération immersive de robots humanoïdes et apprentissage de modèles de comportements socio-communicatifs), AI-REPS (Etude de représentations sémantiques communes entre intelligence artificielle et humaine) ou encore le projet européen H2020 Victoria (analyse vidéo pour la recherche d’activités criminelles et terroristes).

Enfin, de nombreux partenariats entre les laboratoires académique de l’Institut Carnot et des acteurs industriels ont permis le développement de plusieurs projets de recherche applicative, que ce soit au travers de thèses CIFRE (apprentissage profond pour la classification d’émotions dans la parole, recherche d’information dans les contenus parlés…) ou de projets financés (modèle affectif pour des agents conversationnels, lecture des patients atteints de DMLA grâce à la simplification automatique de texte, traduction automatique neurone…).