La Chine donne la parole à Mona Lisa

MonaLisa

L’exposition des arts interactifs de Pékin (World Classic Interactive Arts) est l’occasion de découvrir une toute nouvelle version de soixante oeuvres dont notre célèbre Mona Lisa !

Il s’agit d’une version numérisée, avec rendu 3D et interactivité, d’une Joconde plus vraie que nature. Elle adresse la parole aux passants, répond à leurs questions et raconte sa vie, le tout en Mandarin …

«C’est la première fois que la technologie 3D, la technologie holographique et la technologie de reconnaissance vocale fusionnent pour une seule et même exposition », explique Wang Hui, le directeur de l’exposition chinoise.

ASUS prend des risques !

Alors que de nombreux états américains interdisent le SMS au volant et que certains proposent des outils pour en encadrer l’usage (et il faut bien reconnaître que c’est nettement plus dangereux que de simplement téléphoner) voilà qui propose son nouvel appareil en expliquant qu’il est Car Ready …

Le Touchscreen EeeTop ET2002 est un ordinateur façon tablette, dont l’interface est tactile et vocale. Une vidéo est proposée pour s’en convaincre :

http://gizmodo.com/5346048/asus-puts-voice-recognition-in-20+inch-touchscreen-eeetop-et2002-now-car-ready

Star Trek pour iPhone

C’est sans doute pour bientôt !

Un brevet déposé par Apple semble montrer que le sujet est sérieux et le Baltimore Sun a même trouvé un schéma fort … parlant :

Il semble, à la lecture du brevet, qu’il faille ajouter un chipset pour effectuer la reconnaissance de la parole … ce qui pose des problèmes industriels complexes et nous amène à penser que ce ne sera pas dans la prochaine version …

A suivre

Avaya et Loquendo renforcent leurs liens

Loquendo, qui faisait déjà partie du programme de partenariat d’Avaya annonçait hier un renforcement de ce partenariat et une intégration plus large des technologies vocales.

Voice Portal, la plate-forme vocale pour les services clients d’Avaya, intégrera donc les 27 langues de la reconnaissance vocale Loquendo. Ces outils seront aussi disponibles dans d’autres offres comme l’Intelligent Customer Routing et Proactive Outreach, l’offre multi-canal.

Cet accord a été conclu car Avaya mesure un accroissement de la demande de services automatisés, selon le directeur général de la division des centres d’appels, Anthony Bartolo.

Il est intéressant de noter que les deux acteurs ont remporté de beaux succès avec des services d’information sur le football et la vente de tickets, notamment avec VIVA en Bolivie.

Nuance aime la musique indienne

En Inde la musique, tout comme le cinéma, est une valeur sûre ! Aussi, prenant le pas de ce que propose Airtel (cf. notre billet du 4 mai) voilà Nuance qui propose un moteur de recherche de musique en 11 langues indiennes, Kannada, Malayalam, Tamil, Telugu, Oriya, Marathi, Punjabi, Bengali, Gujarati, Hindi et anglais Indien.

Ce service devrait être opérationnel en novembre, avec quelques opérateurs télécom locaux. Avec Google qui propose son 411, OnMobile et Telisma, les offres de speech2Text d’Ubona et EnglishSeekho … on voit là que le marché indien attise les appétits !

Antonio Banderas rencontre … Julie !

Julie est la voix du service interactif de la compagnie de train Amtrak … le Saturday Night Live de la NBC en a fait une parodie avec la participation d’Antonio Banderas.

Certains travers des systèmes automatiques y sont mis en évidence … ainsi que la perception globale des utilisateurs …

Sourions et profitons-en pour réfléchir à nos ergonomies !

Parler à son cockpit

Grâce à VoiceFlight Systems, il est possible de parler à son cockpit et plus seulement à la tour de contrôle !

voiceflight Le VFS101 a été crée par Scott Merritt afin d’indiquer vocalement les plans de vol. Adapté aux conditions spécifiques de bruit (on ne peut pas dire que les cockpits soient silencieux …) ce système a été agréé par la FAA connue pour ses critères drastiques. Le tout sans apprentissage vocal et en main libre. Il semblerait que le gain soit appréciable, un plan de vol est saisi en dix fois moins de temps qu’avec les boutons traditionnels.

Prévu pour fonctionner avec les GPS avion Garmin GNS 430 et 530, certifié pour Cessna, il coûte quand même près de 3 000 $.

Tactile ou vocal ?

Le marché des smartphones explose (41 millions au second semestre soit +27 %), avec un net avantage pour les écrans tactiles.

Canalys publie une étude sur les tendances qui montre que l’interface tactile à nettement pris le pas, avec une progression de 3,9 à 15 millions d’unités en un an ! Le plus grand perdant c’est le keypad …

Et l’étude de conclure que la reconnaissance vocale sera l’interface principale pour piloter son smartphone.

Pour en savoir plus : canalys

Un nouvel algorithme en reconnaissance de la parole ?

Une collaboration entre université allemande et britannique semble prometteuse pour améliorer la reconnaissance de la parole. L’institut « Human Cognitive and Brain Sciences » de l’université Max Planck de Leipzig et le Wellcome Trust Center for Neuroimaging annoncent en effet un nouveau modèle mathématique qui serait beaucoup moins sensible aux bruits. Notre cerveau sait mieux distinguer la parole des séquences bruyantes temporelles comme l’explique Stefan Kiebel, aussi une analyse prenant en compte les « niveaux temporels » (dans une discussion sur l’été, les lettres SU sont plus susceptibles d’annoncer SUN que SUPER …) doit donner des résultats plus précis. Le défaut réside alors dans les conversations où les acteurs changent de sujet !

La patience s’impose, cette recherche neuroscientifique promet des résultats à court terme, avec des exemples concrets dans … quelques années !