Succès pour les applications vocales iPhone et iPad

Selon Sharon Machlis, les applications vocales commencent à prendre le pas sur le clavier tactile de nos assistants préférés.

On connait déjà le succès de Dragon Dictation de Nuance, Google emboîte le pas avec Search et Translate, et Sharon en fait une revue détaillée. Certes tout n’est pas parfait, mais elle pense que ces appareils vont favoriser la propagation des fonctions de reconnaissance vocale.

Lire l’article sur Computer World

Acapela fait parler la TNT

Afin de faciliter la vie des mal-voyants, pilule la ONCE (organisation espagnole très dynamique) a fait développer le TV Speak à Code Factory.

Cette solution vocalise les informations de la TNT, sale avec la synthèse vocale Acapela sur le téléviseur et donne accès aux chaînes, guides TV, téletexte, enregitrement … et coûte 275 €.

Le logiciel est compatible avec windows XP, Vista et Seven. A trouver sur le site CECIAA

Ford comprend les intentions des conducteurs

Ford était déjà pionnier avec l’aide de Nuance et son système Sync d’assistance vocale au conducteur.

Mais voilà qu’ils se proposent de comprendre les intentions des conducteurs ! En analysant mieux le sens des mots, le système devrait guider l’utilisateur et l’assister dans sa recherche. Sync comprend pourtant 10 000 commandes, mais Ford juge cela encore incomplet et teste de nouveaux algorithmes.

Ainsi si le conducteur dit « je veux changer la température » le programme lui demandera s’il veut baisser ou augmenter, car l’ordre est clair mais incomplet …

Ford annonce aussi que l’usage progresse, 85% des automobilistes équipés utilisant maintenant régulièrement les commandes vocales (ils n’étaient que 70% en 2010).

Nuance rachète SVOX

Afin de se renforcer dans le marché automobile et embarqué, Nuance vient d’acquérir le grand spécialiste des solutions embarquées, Svox. Le jour même où les journaux américains se font l’écho d’un Bill Gates qui annonce que la reconnaissance vocale est le « next big thing ».

Cette acquisition permettra à Nuance d’enrichir ses offres en automobile et de profiter du beau carnet d’adresses de Svox.

Quand le DAB repère les menteurs …

En Russie, les nouveaux distributeurs automatiques de la Sberbank vont détecter les fraudeurs avec de la reconnaissance faciale, vocale et les empreintes digitales.

La partie vocale a d’ailleurs été développée par le Speech Technology Center, une entreprise très liée à la Federal Security Service, successeur du KGB. Et utilise les bases de données de la police avec les enregistrements vocaux des personnes interrogées …

La machine pourra aussi scanner un passeport, le visage en 3 dimensions et mémoriser les empreintes avant de vérifier si la personne qui demande l’ouverture d’un compte ment sur son emploi.

Comme quoi les pays n’ont pas tous le même sens du respect de la vie privée … imaginez le bruit que ferait une telle annonce en France !

Google en reconnaissance vocale

Nous avons souvent parlé des travaux de Google sur la reconnaissance de la parole, et depuis quelques semaines ce sujet est souvent évoqué.

Ils viennent d’organiser à San Francisco une conférence InsideSearch qui mérite le détour, vous trouverez ICI les vidéos des meilleurs moments.

Les principes à retenir : le web et le mobile s’enrichissent mutuellement en analysant l’expérience utilisateur. Ainsi la reconnaissance (d’image comme de parole) développés pour Android va enrichir Chrome. En Europe il faudra attendre un peu avant de voir Goggles et VoiceSearch cependant … mais on les trouve dans le Labs du moteur US !

55 langues sur iPhone

RantNetwork, annonce le Communilator, la première application capable de traduire en 55 langues !

Il suffira de capturer le texte avec l’appareil photo puis de choisir la langue cible pour l’écouter grâce au TTS de Loquendo. Voila de quoi satisfaire les globe trotters qui ne maîtrisent pas toutes les langues …

Bientôt disponible, vous trouverez l’application sur le site Communilator

Et si vous parliez à votre télévision ?

Microsoft a présenté l’intégration des technologies vocales et de Bing sur sa Xbox 360 lors du salon E3 de Los Angeles.

On savait déjà que Bing bénéficiait de l’expertise de Tellme, acquis il y a quelques années, et voilà que ce qui a été fait pour Kinect au niveau des jeux va être disponible pour les loisirs. Sur la Xbox il sera possible d’accéder vocalement aux contenus de Netflix, Hulu, ESPN … de trouver des vidéos, des musiques, des jeux, de l’information.

Don Mattrick, président de la branche « Interactive Entertainment Business » de Microsoft expliquait que cela apportait toute l’intelligence de Bing à la Xbox et ouvrirait de nouvelles perspectives. Xbox Live a d’ailleurs conclu de nombreux accords avec des chaines, y compris Canal+ en France.

Google joue à cache cache …

Souvenez-vous, il y a quelques années (en 2007) Google lançait un annuaire gratuit concurrent des offres payantes, pour éprouver son moteur de reconnaissance de la parole.

Puis le fermait brutalement, avec une annonce laconique sur son blog.

Voilà que les taquins de Mountain View recommencent !

Après avoir bien fait parler d’eux à propos de leur traduction instantanée, laissant une API à disposition des développeurs, ils ferment brutalement le service en parlant d’abus … (cf. le billet du blog officiel Google)

Mais, cette fois, le service pourrait redevenir accessible … moyennant finances !

En effet, une version payante arriverait bientôt, selon CNET.