Siri va faire des progrès avec des neurones

Comme toujours WIRED nous offre une vision d’avenir intéressante avec un court article sur les recherches en réseaux de neurones et apprentissage … et prédit une forte évolution de la compréhension de nos souhaits par l’outil phare de l’iPhone.

On en profitera pour se demander ce qui va se produire si Samsung rachète Nuance, l’éditeur à la base de la partie vocale de Siri (pour mémoire, les réponses sont fournies par le moteur de recherche Wolfram …)

Bonne lecture : Wired « Siri Will Soon Understand You a Whole Lot Better »

Le langage naturel devient une réalité

Beaucoup a été dit et écrit sur le langage naturel … et beaucoup d’initiatives ont tenté pour que la machine puisse vraiment dialoguer.

Aussi c’est avec un mélange d’intérêt et de prudence que j’ai étudié une approche récente du sujet, dont les premières démonstrations étaient prometteuses. Depuis, les créateurs de cette start-up ont réussi 3 projets concrets avec des entreprises européennes qui forcent l’admiration.

Etant tenu au secret je ne puis vous en dire plus … mais je pourrai sans doute en évoquer plus la semaine prochaine. Si le sujet vous intrigue, écrivez-moi à philippe (at) vocalnews.info que nous convenions d’un rendez-vous.

A suivre … de près …

SkyPhrase bouscule Siri

Une vidéo a fait beaucoup parler depuis peu … elle montre un concurrent à Siri qui étonne par sa fluidité.

Certes il s’agit d’une vidéo et l’on est en droit d’attendre de le tester pratiquement pour voir si le langage naturel proposé est aussi évolué. Vous constaterez ci-dessous les progrès réalisés :


Télécharger | Convertir en MP3 | Replay Media Catcher

C’est une start-up, Skyphrase, récemment rachetée par Yahoo! qui a développé cet assistant intelligent, gageons que cela va redonner quelque enthousiasme au marché du vocal.

Quand le sondage client devient automatique

Digivoc, jeune pousse lannionnaise, développe une solution d’enquêtes de satisfaction automatisées sur le fixe comme sur le mobile.

La solution Digivoc est une plateforme logicielle cloud complète permettant de concevoir, réaliser et synthétiser une ou plusieurs campagnes de sondage de satisfaction clientèle tout en réduisant considérablement les coûts d’acquisition des réponses en utilisant des technologies automatiques.

L’objectif est de permettre aux entreprises d’augmenter la satisfaction du client et d’accélérer le processus de fidélisation. Cette première version a déjà séduit ses premiers clients en à peine 6 mois d’existence …

Encouragée par ses succès, l’entreprise vient de lancer son offre de sondages vocaux en mode self-service web. Une version Freemium permet de tester le service sur www.digivoc.com.

Afin de poursuivre sa croissance, l’entreprise, qui compte déjà 5 personnes, a initié une démarche de levée de fonds auprès de Business Angels.

Les agriculteurs en reconnaissance vocale

Loin des préjugés, les agriculteurs sont de fervents utilisateurs des nouvelles technologies, voire des technologies tout court ! Il suffit de voir des machines agricoles pilotées par GPS pour s’en convaincre.

Voici qu’une société leur propose de gérer leurs tâches avec une application smartphone pilotée vocalement. Jacques Brégard, fondateur de la société Portik, est à l’origine de cette innovation avec l’aide des sociétés Tykomz et Télécom-Bretagne et le soutien d’OSEO.

Toutes les tâches à faire, en cours ou finies sont mémorisées après que l’utilisateur ait dicté ses termes à l’application, en langage naturel. Ensuite, de retour à son bureau, tout sera synchronisé avec l’ordinateur. Plus de calepin à re-saisir …

Pour en savoir plus : Portik.fr

Commande vocale et sécurité …

Alors que Nuance avait démontré, avec son étude « In-Car Distraction Study 2008″, que la commande vocale était fiable … voilà une étude qui semble prouver le contraire.

Le Texas A&M’s Transportation Institute, un institut américain de recherche sur la sécurité dans les transports, a comparé des conducteurs, certains répondant à des SMS via Siri ou Vlingo, d’autres conduisant seulement. Ainsi ils notent que le regard des conducteurs était dirigé vers la route 37,3 secondes par minute, contre 27,2 avec Siri et 28,6 avec Vlingo. (N.B. les autres secondes, le regard s’oriente vers le compteur de vitesse, les rétroviseurs ou les commandes de la voiture).

Cependant ils ont oublié de comparer avec ceux qui répondent à leurs SMS au clavier … mais bien sûr, ni vous ni moi n’avons jamais fait cela …

On aurait aussi apprécié que l’étude se penche sur la distraction que peuvent provoquer les autoradios et autres passagers … avant de donner des arguments aux sécuritaires.

Heureusement, dans quelques années, tous ces sujets s’évaporeront, quand ce sera l’ordinateur qui se chargera de conduire …

Agnitio savoure l’effet Cahuzac

Nous en parlions le 21 mars, à peine la nouvelle dévoilée, c’est le logiciel de Biométrie Vocale de l’espagnol Agnitio, BatVoice, qui démontrait que la voix enregistrée était bien celle du Ministre du Budget.

AgnitioHomePage

Cette affaire a permis à l’éditeur de logiciel un fort éclairage médiatique sur l’intérêt de ses solutions. Ils en profitent donc directement sur leur site, en mentionnant l’article de 01net. La biométrie vocale dans son ensemble va sans doute profiter de cette aubaine.

Au passage, les 8 & 9 mai, à San Francisco, vous pourrez tout découvrir lors de la VoiceBiometricsConference et écouter le fondateur d’Agnitio, Emilio Martinez.

 

 

7 usages de reconnaissance vocale

Maintenant que tout le monde reconnait l’intérêt de a reconnaissance vocale grâce à Siri, les usages se développent. Voici quelques exemples marquants.

1: L’automobile

Alors que Ford équipe toutes ses voitures avec SYNC, d’autres constructeurs ajoutent des fonctions évoluées à bord, comme BMW sur la 750 LXI qui exploite l’offre Dragon Drive de Nuance, ou Chevrolet avec Siri Eyes Free dans ses futurs Sonic et Spark.

2: La recherche d’information

Google propose maintenant une version en langage naturel de Google Search sur les mobiles (iOS comme Android) et simplifie la recherche d’information en situation nomade. Et la dernière version prend en compte le contexte, si vous demandez « quelles sont les expositions de musée », la réponse vous ajoutera le nom des musées les plus proches.

3: La télévision

Alors que la télévision connectée tarde à venir, voici déjà la Viera WT60 de Panasonic qui écoutera vos souhaits pour les afficher à l’écran et les exécuter. Ce téléviseur peut même faire des recherches sur le web, et non seulement changer de chaîne …

4: La dictée

La toute dernière version de Dragon, notamment la version 3 pour MacOS, est juste remarquable, d’ailleurs ce billet a été entièrement écrit avec ce moteur de dictée et fort peu de corrections. Il faudra juste l’entraîner à votre diction et vous habituer à dire la ponctuation souhaitée.

5: La photographie

Pour ajouter des effets à vos photos sur iPad, Pixeltone se propose de vous écouter. Adobe et l’université du Michigan ont travaillé ensemble pour vous proposer cet usage inhabituel de la reconnaissance vocale.

6: L’assistant

Si vous n’avez pas d’iPhone, vous pouvez charger Indigo de Artificial Solutions, le meilleur assistant vocale sous Android (et il y en a beaucoup qui ont tenté d’imiter Siri …)

7: Les serveurs vocaux

Oui, non seulement beaucoup n’utilisent plus les touches pour comprendre vos choix, mais certains sont passés au langage naturel, comme le Crédit Agricole de Normandie.

 

 

 

Kapsys pense toujours reconnaissance vocale

La société d’Aram Hekimian, qui nous avait étonné en 2008 avec son GPS Kapten, revient avec une nouvelle idée originale : le smartphone pour personnes handicapées.

Présenté au Mobile World Congress, deux appareils SmartConnect et SmartVision proposent d’apporter une meilleure expérience aux déficients visuels. Tout en profitant du savoir-faire de l’entreprise autour des technologies vocales.

Smartconnect

Un simple bouton active la commande vocale pour appeler, dicter ou lire un SMS, mais aussi choisir ses applications. On trouvera aussi un lecteur de tag NFC, un GPS vocal (quand même), une application de secours avec géolocalisation, une loupe ou encore la transmission vidéo sans fil vers la télévision.

Ces appareils seront bientôt disponibles dans les réseaux des opérateurs.