Reda Dehak (EPITA) : 1er prix en équipe de l’Interspeech 2009 Emotion Challenge
Reda Dehak, enseignant-chercheur au Laboratoire de Recherche et Développement de l’EPITA vient de remporter le premier prix en équipe de l’Interspeech 2009 Emotion Challenge Award de Brighton pour son travail sur la reconnaissance sonore des émotions au sein de l’équipe CRIM. Reda Dehak nous explique comment ces méthodes seront applicables dans plusieurs domaines commerciaux ou médicaux d’ici peu.
« Nous avons remporté en septembre le prix de reconnaissance des émotions positives et négatives, à l’occasion de l’Interspeech Emotion Challenge 2009 de l’International Speech Communication Association, premier concours de reconnaissance des émotions par ordinateur à partir de la voix, concours organisé à l’échelle mondiale. Avec un taux de reconnaissance surpassant de 2,6 % le meilleur système de détection des émotions positives et négatives, l’équipe du CRIM* s’est significativement distinguée de ses concurrents sur des extraits audio de voix d’enfants de durées extrêmement courtes.
À partir d’extraits d’à peine une à trois secondes où l’on entendait des enfants exprimer un mot ou deux en allemand, l’équipe du CRIM a réussi à déterminer la tendance de leur émotion en s’appuyant uniquement sur l’acoustique et la prosodie, c’est-à-dire la hauteur et l’intensité du son émis durant l’expression de syllabes. Il y avait deux types d’émotions (positive ou négative) qu’il fallait séparer grâce au logiciel. La reconnaissance des émotions en est au balbutiement, loin de la reconnaissance du locuteur sur laquelle nous avons déjà énormément d’outils performants.
L’équipe menée par Pierre Dumouchel réunissait deux doctorants à l’École de technologie supérieure (ÉTS) en reconnaissance de l’identité à l’aide de la voix et en signal audio, à savoir Najim Dehak (présentement post-doctorant au Massachusetts Institute of Technology – MIT, codirigé par MM. Dumouchel et Patrick Kenny, chercheur au CRIM) et Yazid Attabi, (dirigé par M. Dumouchel) ainsi que Réda Dehak, donc, professeur à l’ÉPITA), en France et Narjès Boufaden, également chercheure au CRIM..
Quelles applications commerciales et sociales pour cette avancée ?
Rappeler un consommateur frustré, par exemple, une demande de la société Bell. Si je téléphone à un centre d’appel pour un problème technique et que je dois répondre à des questions posées par un automate, le logiciel sera capable de détecter l’agacement montant dans la voix du client et le switchera automatiquement sur un humain qui canalisera l’agressivité en y apportant une approche plus adaptée à la situation. Une autre application, médicale cette fois, serait de reconnaître la sincérité à vouloir poursuivre un traitement dans la voix d’alcooliques ou de toxicomanes ».
—
CRIM :
Le CRIM est le Centre de Recherche appliquée en Technologies de l’Information de Montréal, qui développe et transfère des technologies et des connaissances, pour valoriser les produits et services des entreprises et organismes, et contribuer à leur commercialisation. Le CRIME réalise une large gamme d’activités qui incluent : la planification, le pilotage et la réalisation de projets de recherche-développement avec des universités, des entreprises ou des centres de recherche; l’organisation de formations spécialisées ; la réalisation de tests de logiciels et de projets d’accompagnement; la sensibilisation à la sécurité de l’information et l’organisation d’événements scientifiques et technologiques. »