Audi passe au vocal

Audi a choisi d’intégrer les applications vocales de Nuance dans ses nouveaux modèles A8.

Alliant navigation, physician click multimédia et téléphonie, for sale les commandes vocales du nouveau système d’info-divertissement d’Audi offrent une interface intuitive conçue pour limiter les distractions visuelles et manuelles des automobilistes.

Les fonctionnalités vocales des modèles 2010 de l’Audi A8 J’énonce ma destination en une seule fois : Grâce à l’application One-Shot Destination Entry de Nuance, les conducteurs dictent leur adresse de destination en une seule commande vocale, c’est extrêmement simple. Il suffit par exemple de dire « Boulogne Billancourt, 47 avenue Edouard Vaillant » pour que le GPS du système MMI Touch calcule l’itinéraire. A moyen terme, l’accès au répertoire de contacts accélérera encore la procédure. En effet, le conducteur pourra dire « Aller au domicile de John Smith », ce qui déclenchera la recherche d’itinéraire.

Je sélectionne une chanson : Music Search permet la sélection vocale des morceaux de musique par simple dictée de la source audio, du genre, de l’artiste, de l’album ou de la chanson. Avec les commandes vocales en langage naturel intégrées au système d’info-divertissement des Audi A8, les utilisateurs ont simplement à prononcer « Lire l’artiste Lady Gaga » ou « Lire le titre Bad Romance », par exemple. Grâce à la reconnaissance vocale multilingue, Music Search sait gérer les commandes en différentes langues. Le système propose également la sélection vocale de stations de radio par nom ou fréquence et le contrôle vocal des lecteurs de CD, DVD et MP3.

Les commandes vocales intégrées permettent aussi la numérotation vocale. Le répertoire peut inclure jusqu’à 2 000 contacts, dont 50 entièrement personnalisables. L’utilisateur peut énoncer « Maman » ou « Bureau » par exemple, pour accélérer l’accès aux contacts les plus fréquents.

DELL lance la tablette Mini 5

Le magazine Engadget ayant vu un prototype de la tablette de Dell, on sait maintenant que l’appareil sera à mi-chemin entre le smartphone et la tablette,fonctionnera sous Android et verra le jour courant 2010.

Le prototype découvert en Chine, étonne avec son écran 5 pouces, et ses fonctions GPS, WiFi, Bluetooth … et la quantité d’applications déjà prévues, dont la reconnaissance vocale fourni par Nuance, afin d’optimiser l’interface.

Comme toujours avec les prototypes, le Mini5 est sujet à modifications, mais on constate une forte convergence entre mobiles et ordinateurs.

Dictée vocale sur Apple, avec Nuance

Si le logiciel de dictée vocale de Nuance, Dragon Naturally Speaking, fait des heureux dans le monde Windows, il n’en était pas de même pour le monde Apple. MacSpeech avait bien un logiciel dont la version française est apparue fin 2009 et on était en droit de se demander quand viendrait la réplique de Nuance.

Elle vient de tomber, non pas avec une version dédiée Mac de Dragon, mais tout simplement par l’annonce du rachat de MacSpeech par Nuance Communications !

Au passage on note que le coeur du produit de MacSpeech n’était autre … que le moteur de Dragon, le moteur de reconnaissance vocale de Nuance.

On sent là que Nuance s’intéresse aux solutions Apple, surtout si on se souvient que la société vient de sortir successivement deux applications iPhone (Dragon Search et Dragon Dictate) qui étonnent par leur efficacité (voir nos billets de décembre sur Dictate et sur Search).

On n’arrête pas le progrès …

Nuance rachète Spinvox

Le marché de la dictée vocale sur mobile devrait être très porteur, les chiffres (150 milliards de messages vocaux échangés chaque année) sont là pour faire rêver.

Aussi Nuance, non content d’avoir lancé Dragon sur iPhone récemment, vient d’annoncer le rachat de Spinvox qui s’était bien illustré sur ce secteur avant de défrayer la chronique pendant l’été. Le coût de cette transaction s’élève à 102,5 millions de dollars, incluant 66 millions de dollars en cash et des actions de Nuance Communications pour une valeur de 36,5 millions de dollars.

Au passage Nuance récupère les intéressants contrats opérateurs signés par Spinvox : Alltel, Bell Mobility, Rogers Wireless, TELUS, Movistar, Optus, Vodacom, Vodafone Spain, Telstra, Skype …

Nuance vous aide à trouver

Nous l’annoncé lors du lancement de Dragon Dictate, voici Dragon Search pour l’iPhone par Nuance.

DragonSearch Le spécialiste du traitement de la parole semble bien déterminé à ne pas laisser le champ libre à Google, Vlingo ou Yahoo qui ont compris que la voix est une interface fondamentale pour les mobiles, fussent-ils dotés d’écrans. Et la recherche d’informations, notamment locales, est un des usages clé. Aussi cette nouvelle application permet-elle de trouver simplement et rapidement sur internet. Basée sur les moteurs traditionnels (on a le choix entre Google, Yahoo et Bing) mais aussi sur Wikipedia, Twitter, Youtube.

Et tout comme dans Dictate, l’interface est intuitive et efficace.

C’est en américain seulement, et disponible uniquement sur l’appStore US (mais on expliquait récemment comment faire pour l’obtenir malgré ce Yalta) alors n’hésitez pas à vous le procurer.

Parlez à votre iPhone … suite !

Bonne nouvelle !

Il est possible de télécharger l’application Dragon de Nuance, même si elle est réservée au marché américain. Et cela vaut le détour car cette application est tout simplement REMARQUABLE ! Simple, intuitive (je ne vous expliquerai pas comment effacer un mot ou transmettre le texte, tellement c’est évident) mais surtout étonnamment efficace et rapide (bien que la transcription se fasse sur un serveur distant).

Il faut parler clairement, mais même si votre accent américain laisse à désirer, la transcription est quasi juste à chaque mot. Parfois Dragon se laisse à quelques dérivations poétiques …

Nuance ouvre là une voie qui montre l’avenir des interfaces des appareils qui envahissent notre quotidien. Et réussit à avancer dans le difficile exercice de la transcription, là où des acteurs comme Spinvox ont annoncé bien plus qu’ils n’en réalisaient. Au passage, Nuance serait en train de racheter Spinvox pour quelques 150 millions de $ (la société était valorisée 500 il y a peu …)

Il ne vous reste plus qu’à découvrir comment télécharger cette application et je vous laisse découvrir la ruse d’Alexandre Laurent sur l’excellent blog iphone et merci à Sylvain Comte de me l’avoir signalé !

Et, ensuite, cliquez ici :

N.B. de nombreux commentaires semble s’émouvoir du fait que l’application espionne leur carnet d’adresse. Or, renseignements pris, il s’agit bien d’un téléchargement par Nuance des noms (et seulement des noms, pas des numéros de téléphone ou emails) dans le but d’améliorer leur reconnaissance, beaucoup d’utilisateurs dictant des messages à l’attention de leurs correspondants. Par contre, il est clair que Nuance aurait pu communiquer plus clairement sur ses intentions, ce qui ne ressort pas du texte légal …

Dictée vocale sans fil

Philips passe au sans fil et offre une ergonomie améliorée et un design futuriste pour son outil de dictée.

Déjà pré-annoncé courant 2009, price Philips annonce la sortie du SpeechMike Air, la version sans fil de l’appareil d’enregistrement audio professionnel le plus vendu dans le monde. Le concept du SpeechMike qui connaît un grand succès, comprend, dans un seul appareil, un microphone de dictée, un haut-parleur, un système de contrôle de dictée et un navigateur PC. En plus d’un grand nombre de nouvelles fonctions, le SpeechMike Air frappe par son design : son boîtier élégant mais robuste, les boutons de contrôle plus grands et sa ligne affinée ont été spécifiquement mis au point pour répondre aux besoins des utilisateurs réguliers de dictée. La qualité d’enregistrement a encore été améliorée, faisant du SpeechMike Air l’appareil de référence dans le domaine de la reconnaissance vocale.

speechmike

Le SpeechMike est compatible avec Dragon Naturally Speaking®, le logiciel leader mondial de la reconnaissance vocale de Nuance : les fonctions clés de ce logiciel peuvent être directement contrôlées par un bouton en utilisant le nouveau logiciel de contrôle Philips Speech Control qui est fourni avec chaque SpeechMike. Grâce à des réglages préinstallés par défaut, le SpeechMike est immédiatement opérationnel. Le logiciel Speech Control permet également d’affecter des fonctions spécifiques aux boutons programmables, ce qui permet à chaque utilisateur de personnaliser l’appareil selon ses préférences.

Le design du SpeechMike Air a été influencé par les résultats des dernières recherches en ergonomie. Les mouvements des utilisateurs pendant une dictée ont été analysés en détail : les boutons les plus importants ont été agrandis et positionnés à portée du pouce pour réduire les mouvements au minimum. La dictée elle-même a encore été simplifiée grâce à la fonction « pousser pour dicter » : les fonctions de démarrage et d’arrêt peuvent être contrôlées par un seul bouton, ce qui permet à l’utilisateur de dicter de façon intuitive.

En plus de l’appareil audio, le système SpeechMike Air intègre la station d’accueil SpeechMike AirPort. Cette station d’accueil se connecte au PC et permet de transférer des données et de recharger le micro. Il intègre également le module de réception SpeechMike AirBridge qui gère les enregistrements provenant de l’appareil de dictée, sans fil avec une portée maximale de 10 mètres. Le module de réception SpeechMike AirBridge peut aussi être utilisé sans être connecté à la station d’accueil. Par exemple, le module AirBridge peut se connecter à un ordinateur portable via son câble USB, ce qui permet à son utilisateur de dicter normalement avec son SpeechMike Air et de bénéficier d’une mobilité totale. Le transfert des données est crypté sans erreurs et s’effectue en Bluetooth via un protocole de transmission de données spécifiquement conçu. Si l’utilisateur dépasse la portée de réception du SpeechMike, l’appareil émet un signal vibratoire.

Le potentiel du SpeechMike Air peut être totalement exploité avec les solutions de gestion de dictée numérique SpeechExec Pro et SpeechExec Enterprise ou en intégration avec les systèmes spécifiques sectoriels, par exemple dans le médical ou le juridique. Cette intégration est rendue possible grâce au kit logiciel séparé SDK (Software Development Kit – Kit de Développement Logiciel). Le SpeechMike Air fonctionne comme n’importe quel appareil standard USB, permettant cette intégration facile qui fait la réputation des SpeechMike filaires.

Mobile et voix la vraie convergence

Un article de VentureBeat semble avoir beaucoup d’échos outre atlantique. Son titre est évocateur : The next big thing in mobile is … voice ?

Si l’on constate que les applications web et les SMS ont pris le pas sur la voix, que d’autres usages comme twitter connaissent une impressionnante croissance, il n’en demeure pas moins que ces applications ont une durée de vie limitée. La principale difficulté vient des claviers et de nos doigts qui n’ont pas diminués de taille … Et le vrai changement réside plus dans les appareils que dans l’usage des moyens de communication. La parole demeure un média fondamental !

Or l’article de Michael Lambert, directeur marketing de Ditech Networks, constate que les technologies vocales ont fait de réels progrès ces dernières années. Il remarque aussi que le rachat de Jott par Nuance n’est pas plus innocent que l’émergence de Google Voice, de Google Voice Search ou l’implication de Microsoft dans TellMe et dans Vlingo de Yahoo. De nombreuses start-ups arrivent, comme Jingle, Yap!, Ribbit, Digitrad … ou le très controversé Spinvox.

Et la plupart de ces initiatives se concentrent sur des usages simples, centrés sur le besoin et efficaces. De la gestion d’agenda à la recherche d’information, en passant par le contrôle de la musique ou de tout l’appareil comme VoiceOver sur les derniers iPhones.

Mais certains outils étaient encore peu ergonomiques, peu intuitifs, impliquant mal les possibilités de l’opérateur. L’avenir est-il à ce niveau, avec des développements effectués au niveau du réseau, s’affranchissant ainsi des nombreuses différences des appareils … et ouvrant l’accès à tous les terminaux et non aux seuls non smartphones.

Mercedes améliore sa reconnaissance vocale

Mercedes passe son syst§me de navigation embarquée en langage naturel.

Parce qu’ils sont fastidieux à utiliser, en faisant épeler le nom du pays, puis la ville, la rue et confirmer à chaque étape, Mercedes a mis au point un algorithme de reconnaissance vocale capable de comprendre une adresse entière.

Cette évolution du système Linguatronic permet de meilleurs résultats et un usage nettement plus naturel. Il fonctionne dans six langues, concerne 15 pays européens et sera proposé dans un premier temps sur la nouvelle Classe S.

C’est la solution One-Shot Destination Entry de Nuance qui a été choisie pour cette nouvelle version. 73 % des personnes interrogées dans le cadre de son étude sur la simplicité d’utilisation des interfaces à commandes vocales ont déclaré être extrêmement satisfaites des systèmes de navigation embarqués à commandes vocales. En tête des principales améliorations qu’elles souhaiteraient voir développer figurent l’optimisation du langage naturel et de la concision des échanges, ainsi que la réduction du nombre de confirmations.

A noter, selon de récentes enquêtes commanditées par Nuance, les commandes vocales des systèmes de navigation embarqués figurent en tête des fonctions les plus efficaces à réduire la distraction des conducteurs et à simplifier l’utilisation de ces dispositifs.

Et voici les comédiens qui ont prété leurs voix à Mercedes : linguatronic

Transcription … du nouveau !

Nuance se lance dans la transcription avec Jott et Yap annonce un accord avec ReQall !

Jott, précurseur des services de transcription en texte des messages dictés (mémos, SMS, pense-bête …) , vient d’être racheté par Nuance.

Nuance accroît ainsi son portefeuille de services adaptés aux mobiles, fournis en API aux principaux opérateurs.

Quant à Yap, qui avait aussi fait quelques annonces dans ce secteur (nos billets ici et ), équipe l’offre de MyCaption, viennent d’être choisis par ReQall pour son service de rappel de mémos.

ReQall étant le grand concurrent de Jott, on voit que le marché s’active outre atlantique !