Discrète identification vocale

Sans doute avez-vous entendu parler de l’arrestation de ce baron de la drogue grâce à son empreinte vocale … (sinon, l’article du Figaro)

De même les écoutes du système Echelon, qui traquent les terroristes … et espionnent les entreprises.

Les systèmes d’identification vocale, par comparaison du spectre vocal, sont habituellement discrètes, principalement utilisées par les forces de police … alors qu’elles peuvent avoir bien d’autres usages !

Ainsi, pour sécuriser les transactions bancaires, ou améliorer l’expérience client sur les centres d’appels.

On en reparle bientôt, soyez attentifs !!!

Envox et Telisma

Envox annonce un accord avec Telisma pour fournir de la reconnaissance de la parole dans ses solutions de relation client.

Mark D. Flanagan, président d’Envox Worldwide explique que de nombreuses opportunités de développement s’ouvrent grâce aux standards émergeants tels que le MRCP et VoiceXML et permettront d’offrir des services utiles et bon marché.

Laurent Balaine, président de Telisma, se félicite de cet accord qui « permettra de d’augmenter la disponibilité des solutions de reconnaissance vocale en Europe et d’offrir le meilleur rapport qualité/prix aux clients ».

On en reparle sous peu …

Langage naturel

Mémorisez cette icone … vous risquez de la revoir souvent !

Powerset capitalise sur de nombreux travaux, dont ceux du fameux PARC (si, vous savez, l’ancien labo de Xerox toujours pionnier, inventeur du mulot …) pour extraire le sens d’internet ! C’est un moteur de recherche sémantique, capable de comprendre aussi bien les requêtes que les pages indéxées !

Avec deux limites : la qualité sémantique du texte écrit … et la langue !

Vidéo sur YouTube … qui aurait mérité une petite démo !!!


« Le challenge principal est d’amener le système au point où les internautes pourront utiliser Powerset et en apprécier la précision, même si notre technologie n’est pas encore tout à fait au point », ajoute Barney Pell.

Plus d’infos ?

Parler comme Lulli ?

Chercher à l’Université de Caen, Michel Morel utilise la synthèse vocale pour reproduire le parler de l’an 1700 avec l’aide de Philippe Caron, spécialiste du français classique à Poitiers.

« J’ay bien peur que le ciel n’ait pu voir sans envie, le bonheur de ma vie. Et si j’estois aymé mon sort seroit trop doux. »

C’est avec des enregistrements de ce type, issus de Lully, que les chercheurs préparent un modèle linguistique. Pour fournir au logiciel les sons élémentaires dont il aura besoin, il faut retrouver quelle était la diction, le rythme des phrases. Les hypothèses se basent sur différents indices, « des témoignages écrits sur la façon d’articuler ».

Les parties dialoguées des opéras de Lully représentent une manne pour les chercheurs. Il semble qu’on roulait les « r », que le « oi » de François se prononçait « wè », que « un », « in » et « ain » se disaient différemment, etc. « Cela fait un peu penser à un parler de la campagne », note Michel Morel.

Malgré tout, il subsistera « des zones inconnues, notamment dans l’intonation : nous devrons opérer des choix, avertit Michel Morel. L’intérêt du projet est de montrer où mènent ces hypothèses. On les teste grandeur nature ».

C’est le moteur Kali qui sert à la synthèse, la démo est ici