Un dictionnaire bilingue et contextuel en langue des signes

0

C’est une première mondiale, et le fruit d’une collaboration inédite au sein
de l’UNamur. Des chercheurs en linguistique et en informatique mettent
actuellement sur pied un dictionnaire bilingue et contextuel français-langue
des signes de Belgique francophone. Destiné à un large public, il a pour
but de donner le mot ou le signe adéquat, avec la nuance souhaitée par
rapport au contexte de la conversation. Ce projet de recherche innovant
est rendu possible grâce à un financement du Fonds Baillet Latour.

e rêve de ce projet depuis longtemps». Laurence Meurant est linguiste et chercheuse qualifiée du FRS-FNRS. Spécialiste de la langue des signes de Belgique francophone (LSFB), elle collabore depuis près de quinze ans avec l’asbl namuroise « École et surdité » et son programme d’enseignement bilingue pour les enfants sourds développé au sein de l’école Sainte-Marie de Namur. C’est dans ce cadre que l’idée de créer un dictionnaire a germé : « En côtoyant les élèves et les enseignants des classes bilingues, je me suis rendu compte des difficultés que les enfants sourds éprouvaient par rapport aux nuances et aux usages de la langue française. Il leur manquait un outil pour comprendre et utiliser adéquatement les mots et les expressions dans un contexte donné ». Cet outil est en cours de développement à l’UNamur, il s’appuie sur une vaste base de données bilingue comprenant un très grand nombre de textes dans les deux langues (français et LSFB). Il devrait être effectif d’ici trois ans. Concrètement, ce dictionnaire pourra être interrogé dans les deux langues : en tapant un mot ou en signant devant la caméra de son ordinateur. Le résultat obtenu mettra en parallèle le texte comprenant le mot recherché et sa version « vidéo » en
langue des signes. « Cela ressemblera aux dictionnaires Reverso ou Linguee, bien connus des internautes », décrit la chercheuse, « mais au lieu de donner la traduction dans deux langues écrites, il mettra en parallèle une langue écrite et une langue signée ». Cet outil informatique pourra ainsi être utilisé par toutes les personnes passant constamment d’une langue à l’autre : les enfants sourds, les parents, les professeurs, les interprètes. Il les rendra autonomes dans l’amélioration de leur maîtrise de l’une ou de l’autre langue.

Une expertise unique développée à Namur

Pour réaliser un tel dictionnaire, les chercheurs s’appuient sur une solide expertise acquise au fil des années par l’équipe de Laurence Meurant. Dotée d’un laboratoire unique (le LSFB-Lab, inauguré en 2013), elle dispose d’un studio d’enregistrement vidéo et d’une régie. Depuis cinq ans, elle alimente un large corpus informatisé de la LSFB. Il s’agit en quelque sorte d’une vaste « bibliothèque » regroupant des enregistrements de différents types
de discours, signés par une centaine de personnes différentes. Ce corpus, en libre accès depuis 2015 (www.corpus-lsfb.be), permet de sauvegarder l’héritage linguistique et culturel de la Communauté des sourds de Belgique francophone. Il aide aussi les chercheurs à comprendre et à décrire ce qui fait la LSFB dans ses aspects grammaticaux et discursifs. « En 2015, on avait déjà récolté avec ce corpus une très grande quantité de données en langue des signes », explique Laurence Meurant, « j’ai alors contacté Anthony Cleve,
professeur à la Faculté d’informatique, pour savoir s’il était possible techniquement de créer un algorithme pour mettre en parallèle la recherche d’un mot français avec sa traduction en
LSFB. Il a accepté de tester l’idée ! », se souvient la chercheuse. C’est ainsi que le projet institutionnel « SILENT » a été mis sur pied en 2016 pour créer un prototype de l’outil imaginé. Les résultats convaincants de SILENT sont à la base du développement actuel de ce dictionnaire bilingue et contextuel. Une recherche à ce point inédite qu’elle a séduit le Fonds Baillet Latour, qui encourage la recherche d’excellence, soutient l’éducation et favorise l’inclusion sociale en Belgique. Il a décidé de la soutenir financièrement

Un challenge sur le plan informatique

Sans le corpus informatique et la base de données énorme constituée en LSFB, rien n’aurait été possible. C’est ce que confirme Anthony Cleve : « Nous possédons une très grande quantité de textes, ce qui fait l’originalité de ce projet. Et c’est nécessaire, car les ordinateurs ont besoin d’être entraînés par de grandes masses de données ». La réalisation informatique de ce dictionnaire relève d’un double challenge. Il y a tout d’abord le travail d’ingénierie web, pour créer un site performant et fluide d’utilisation. « Jusque-là, ce n’est entifique, la reconnaissance des signes via une webcam n’est pas facile. Nous allons donc choisir les techniques qui conviennent le mieux par rapport aux données et aux conditions matérielles dans lesquelles les signes ont été enregistrés ». Ce challenge n’est rendu possible que grâce au travail de fourmi que les collaborateurs du LSFB-Lab réalisent depuis 2013. Ils visionnent chacune des conversations en LSFB enregistrées dans le labo et les annotent signe par signe. « Il faut noter manuellement chaque début et chaque fin de signe, dans un maximum de contextes de conversation différents. C’est un travail énorme », confie Anthony Cleve. D’ici trois ans, 30 heures de vidéos auront été traduites et annotées. « On est en train de transformer un objet de recherche en un outil utile et pratique », s’enthousiasme Laurence Meurant. Au-delà de la traduction de simples mots
en français-langue des signes, des expressions courantes pourront aussi être interrogées. « Par exemple, on pourra demander au dictionnaire les équivalents de l’expression “pas à pas”, qui ne correspondent bien sûr pas à la suite des équivalents de chacun des trois mots pris séparément », explique Anthony Cleve. L’outil sera utile, au quotidien, à une grande variété d’utilisateurs. La LSFB est pratiquée par environ 4 000 personnes en Belgique francophone. Une fois la technologie mise en place, elle pourra par ailleurs être appliquée à d’autres couples langue vocale-langue signée : le prototype a déjà été testé sur le couple néerlandais– langue des signes des Pays-Bas (NGT), grâce à une collaboration avec le Pr. Onno Crasborn (Université Radboud de Nimègue). On peut donc imaginer à l’avenir un dictionnaire anglais-langue des signes britannique ou encore néerlandais-langue des signes flamande. Au départ de Namur, c’est l’ensemble de la communauté des signeurs en Europe qui pourra bénéficier de cette innovation.

L’équipe de recherche
Laurence Meurant (Namur Institute of Language, Text and Transmediality), Anthony Cleve (Namur Digital Institute), Aurore Paligot (LSBF-Lab), Sibylle Fonzé (Namur Institute of Language, Text and Transmediality), Jérôme Fink (étudiant de la Faculté d’informatique, qui réalisera à partir de janvier 2019 son travail de fin d’études sur la reconnaissance vidéo), Maxime Gobert (il a réalisé le premier prototype du projet SILENT de 2016 à 2017) et Benoît Frenay (Namur Digital Institute).

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.