Reconnaissance vocale en silence

Nous savons tous qu’il est difficile de comprendre une conversation dans un environnement bruyant. Et que les ordinateurs en souffrent tout autant que nous. Et que cela nuit souvent à la réputation des outils de reconnaissance de la parole.

Aussi les méthodes et algorithmes de dé-bruitage viennent de voir une avancée impressionnante. Une start-up israélienne propose une solution baptisée VocalZoom.

La démonstration, présentée ICI, est bluffante.

Et comme nous savons tous que l’avenir de la reconnaissance vocale passe par l’embarqué, du mobile à l’automobile … voilà qui augure bien.

Plus sur VocalZoom

Skype devient interprète !

Cela avait été annoncé, la pré-version devient disponible afin de découvrir la traduction temps réel via Skype.

Oui, ils osent avancer sur ce chemin qui a tant fait rêver, en proposant une traduction qui met en jeu reconnaissance vocale, synthèse vocale et moteur de traduction.

Bientôt plus d’informations sur le sujet, en attendant inscrivez-vous pour me rejoindre comme bêta-testeur : Skype Translator

Siri va faire des progrès avec des neurones

Comme toujours WIRED nous offre une vision d’avenir intéressante avec un court article sur les recherches en réseaux de neurones et apprentissage … et prédit une forte évolution de la compréhension de nos souhaits par l’outil phare de l’iPhone.

On en profitera pour se demander ce qui va se produire si Samsung rachète Nuance, l’éditeur à la base de la partie vocale de Siri (pour mémoire, les réponses sont fournies par le moteur de recherche Wolfram …)

Bonne lecture : Wired « Siri Will Soon Understand You a Whole Lot Better »

Le langage naturel devient une réalité

Beaucoup a été dit et écrit sur le langage naturel … et beaucoup d’initiatives ont tenté pour que la machine puisse vraiment dialoguer.

Aussi c’est avec un mélange d’intérêt et de prudence que j’ai étudié une approche récente du sujet, dont les premières démonstrations étaient prometteuses. Depuis, les créateurs de cette start-up ont réussi 3 projets concrets avec des entreprises européennes qui forcent l’admiration.

Etant tenu au secret je ne puis vous en dire plus … mais je pourrai sans doute en évoquer plus la semaine prochaine. Si le sujet vous intrigue, écrivez-moi à philippe (at) vocalnews.info que nous convenions d’un rendez-vous.

A suivre … de près …

SkyPhrase bouscule Siri

Une vidéo a fait beaucoup parler depuis peu … elle montre un concurrent à Siri qui étonne par sa fluidité.

Certes il s’agit d’une vidéo et l’on est en droit d’attendre de le tester pratiquement pour voir si le langage naturel proposé est aussi évolué. Vous constaterez ci-dessous les progrès réalisés :

C’est une start-up, Skyphrase, récemment rachetée par Yahoo! qui a développé cet assistant intelligent, gageons que cela va redonner quelque enthousiasme au marché du vocal.

Quand le sondage client devient automatique

Digivoc, jeune pousse lannionnaise, développe une solution d’enquêtes de satisfaction automatisées sur le fixe comme sur le mobile.

La solution Digivoc est une plateforme logicielle cloud complète permettant de concevoir, réaliser et synthétiser une ou plusieurs campagnes de sondage de satisfaction clientèle tout en réduisant considérablement les coûts d’acquisition des réponses en utilisant des technologies automatiques.

L’objectif est de permettre aux entreprises d’augmenter la satisfaction du client et d’accélérer le processus de fidélisation. Cette première version a déjà séduit ses premiers clients en à peine 6 mois d’existence …

Encouragée par ses succès, l’entreprise vient de lancer son offre de sondages vocaux en mode self-service web. Une version Freemium permet de tester le service sur www.digivoc.com.

Afin de poursuivre sa croissance, l’entreprise, qui compte déjà 5 personnes, a initié une démarche de levée de fonds auprès de Business Angels.

Les agriculteurs en reconnaissance vocale

Loin des préjugés, les agriculteurs sont de fervents utilisateurs des nouvelles technologies, voire des technologies tout court ! Il suffit de voir des machines agricoles pilotées par GPS pour s’en convaincre.

Voici qu’une société leur propose de gérer leurs tâches avec une application smartphone pilotée vocalement. Jacques Brégard, fondateur de la société Portik, est à l’origine de cette innovation avec l’aide des sociétés Tykomz et Télécom-Bretagne et le soutien d’OSEO.

Toutes les tâches à faire, en cours ou finies sont mémorisées après que l’utilisateur ait dicté ses termes à l’application, en langage naturel. Ensuite, de retour à son bureau, tout sera synchronisé avec l’ordinateur. Plus de calepin à re-saisir …

Pour en savoir plus : Portik.fr

Commande vocale et sécurité …

Alors que Nuance avait démontré, avec son étude « In-Car Distraction Study 2008″, que la commande vocale était fiable … voilà une étude qui semble prouver le contraire.

Le Texas A&M’s Transportation Institute, un institut américain de recherche sur la sécurité dans les transports, a comparé des conducteurs, certains répondant à des SMS via Siri ou Vlingo, d’autres conduisant seulement. Ainsi ils notent que le regard des conducteurs était dirigé vers la route 37,3 secondes par minute, contre 27,2 avec Siri et 28,6 avec Vlingo. (N.B. les autres secondes, le regard s’oriente vers le compteur de vitesse, les rétroviseurs ou les commandes de la voiture).

Cependant ils ont oublié de comparer avec ceux qui répondent à leurs SMS au clavier … mais bien sûr, ni vous ni moi n’avons jamais fait cela …

On aurait aussi apprécié que l’étude se penche sur la distraction que peuvent provoquer les autoradios et autres passagers … avant de donner des arguments aux sécuritaires.

Heureusement, dans quelques années, tous ces sujets s’évaporeront, quand ce sera l’ordinateur qui se chargera de conduire …