Il était une fois... GV-LEx
Le projet GV-LEx se trouve à l’intersection entre deux domaines d’étude et deux besoins récurrents dans notre société :
- d’un côté, on constate actuellement la montée en puissance de robots, humanoïdes ou non, destinés à avoir un rôle social (éducation et occupation d’enfants, animation, etc.) ou d’assistance (aide aux personnes âgées, aux handicapés, etc.). Ces robots disposent d’une mobilité et d’une capacité d’adaptation de plus en plus grande et peuvent commencer à réellement interagir avec leur environnement mais manquent de l’expressivité nécessaire à une interaction plus profonde, en particulier auprès des enfants.
- de l’autre côté, la synthèse de la parole est de plus en plus utilisée dans des contextes d’accès à l’information (lecture de mails par téléphone, etc.) ou d’assistance (lecture pour malvoyants, etc.). Les performances des outils de synthèse vocale sont suffisantes pour beaucoup de tâches mais, là aussi, l’expressivité est insuffisante pour permettre un rendu suffisamment agréable et convaincant d’une lecture.
L’idée centrale de GV-LEx est de doter un robot de la capacité à effectuer une lecture agréable, avec des capacités d’expressivité basées à la fois sur la voix et la gestuelle. Un tel robot aurait une vertu pédagogique importante auprès des enfants et auprès des adultes.
Les trois objectifs du projet
- Développer un outil de compréhension automatique du texte (son sens et sa structure) qui permettra d’identifier l’interprétation qu’il faut en faire lors de la lecture.
- Synthétiser une voix expressive
- Générer des gestes expressifs qui seront synchronisés avec la synthèse de la parole.
Les verrous à lever
- Identifier dans le texte ce qui peut et doit générer de l’expressivité,
- Modéliser les moyens utilisés par les conteurs humains pour transmettre cette expressivité, dans leur voix et dans leurs gestes,
- Créer des corpus vocaux permettant de synthétiser une voix expressive,
- Développer une bibliothèque des gestes expressifs utilisables par le robot et par l’avatar,
- Synchroniser du geste et de la voix,
- Développer un outil de retouche manuelle pour permettre de rectifier l’interprétation automatique faite par le logiciel.
Scénario
- Le robot NAO raconte une histoire pour des enfants de 7-8 ans, structurée, longue de 400 à 1000 mots, pour une durée de 2 à 5 minutes maximum. Il n'y a pas d'intéraction prévue avec le robot. Enfin, le texte est prétraité hors ligne grâce à un logiciel développé spécialement pour GV-LEx.