VocalNews

La TV en reconnaissance vocale

Et voilà ! Nuance profite du CES pour annoncer sa Dragon TV ...

Dragon TV, la première plate-forme vocale et de compréhension du langage naturel pour téléviseurs dédiée aux opérateurs, équipementiers, fournisseurs de TV, périphériques et décodeurs. Dragon TV rend simple et ludique l’accès aux programmes et films. Optimisée par la technologie de reconnaissance vocale et de compréhension du langage naturel de Nuance, Dragon TV simplifie comme jamais la recherche de contenus. Le téléspectateur n’a plus qu’à prononcer le numéro de la chaîne, son nom, ou encore l’intitulé d’un programme ou d’un film. Il est même possible d’effectuer vocalement des recherches par comédien et par genre, tout en restant connecté à Twitter, Facebook ou encore Skype.



D’après une étude de Strategy Analytics, environ 1,6 milliard de téléviseurs seront connectés d’ici à 2014. Or, les télécommandes traditionnelles ne sont plus suffisantes pour accéder au très large choix des chaînes et options multimédias disponibles. C’est là qu’intervient Dragon TV qui permet aux téléspectateurs de naviguer facilement parmi les contenus grâce aux technologies vocales de Nuance. Celui-ci peut s’exprimer le plus spontanément du monde pour obtenir rapidement les résultats de sa recherche de programmes, films, divertissements, etc.



Voici quelques exemples d’énoncés :



« Aller sur France 2 » « Qu’y a-t-il sur M6 ce soir à 21 heures ? » « Quand passe Denisot ? » « Regarder Dexter sur le disque dur » « Trouver des comédies avec Dany Boon »



Disponibilité



Dragon TV de Nuance est disponible dès à présent. Cette nouvelle plate-forme vocale est compatible avec toutes les grandes marques de TV, décodeurs et télécommandes, ainsi qu’avec de nombreux environnements applicatifs, dont Linux, Android et iOS. Pour plus d’information, visitez www.nuancemobilelife.com.

2012 ... année de la reconnaissance vocale !

De grands espoirs étaient placés dans le traitement de la parole par ordinateur, mais force est de constaté que cela a pris du temps. Seul le cinéma anticipait avec efficacité les résultats attendus, notamment avec le terrible ordinateur HAL de 2001 l'odyssée de l'espace.

Mais voilà que le nouveau smartphone d'Apple sort, fin 2011, avec l'assistant Siri, et que tous les journaux et blogs s'extasient devant les capacités vocales de cet appareil. Bien sûr, quelques détracteurs y vont aussi de leurs exemples de ratages sur des accents inhabituels (on se rappelle l'ascenseur qui ne comprend pas l'écossais) ... mais dans l'ensemble ce ne sont que louanges.

Le marketing d'Apple est très fort, car bien avant, Ford avec SYNC, avait déjà équipé nombre de véhicules avec du contrôle vocal efficace sans entrainer autant de passion.

Ce qui est évident, par contre, c'est que les technologies de la parole ont maintenant le vent en poupe, alors excellente année 2012 à vous tous !

Siri fait peur ...

ou quand la reconnaissance vocale donne la chair de poule ...

Tous le monde se souvient de HAL qui prend le contrôle du vaisseau, ou des robots agressif de iRobot ...

Voici, pour notre plus grand plaisir une bande annonce de SIRI, prochain grand film d'horreur :

Si vous ne voyez pas la vidéo en incrustation, cliquez ici.

En Android, Siri se dit Majel

Google avait été précurseur en investigant les pistes vocales comme interface homme machine pour le mobile, en créant sa propre équipe de recherche et développement ... Mais Apple lui a volé la vedette en sortant le 4S doté de l'assistant racheté à Siri.

On nest donc pas étonné de voir les rumeurs sur l'imminente mise à disposition d'un assistant sous Android. Fidèle à sa tradition, Google lui a donné un nom issu de StarTrek, Majel étant le nom de l'actrice qui prêtait sa voix ... à l'ordinateur de l'Enterprise ;-)

Majel est une nouvelle version de Voice Actions, qui savait déjà envoyer des messages et contrôler quelques actions du téléphone. La principale novation étant de franchir le cap du langage naturel pour fluidifier les interactions. Ces avancées pourraient être dopées par le très récent rachat de CleverSense, qui a démontré d'intéressantes capacités avec son application Alfred.

Et comme l'essentiel des travaux vocaux proviennent de PhoneticArt racheté en 2010, on trouve beaucoup d'informations sur leur WiKi !

Parlez toutes les langues ... sans les apprendre !

Il est déjà possible de traduire ses textes sur bien des services en ligne, maintenant on va pouvoir parler à n'importe qui et se faire comprendre. Ceci grâce à une traduction instantanée et aux technologies de reconnaissance et synthèse vocale.

Lexifone vient de se rapprocher de Ortsbo pour 2 millions de $ canadiens afin de développer son offer initiée en 2010 par le Dr. Ike Sagie, ancien chercheur des laboratoires IBM et co-fondateur de Attunity. Au passage, Ortsbo propose des traductions en temps réel et a déjà 40 millions d'abonnés à son service ...

En attendant l'ouverture du service, leur vidéo de promotion :

Test comparatif entre Siri et TellMe

Alors que la reconnaissance vocale fait beaucoup parler d'elle, Microsoft a rappelé qu'ils avaient déjà placé des fonctions d'assistant vocal dans leur téléphone mobile. Souvenez-vous que la firme de Redmond a racheté TellMe tout comme Apple a racheté Siri.

Voici un comparatif en vidéo, les résultats parlent d'eux mêmes :

 

Le lien de la vidéo de TechAu sur Youtube

Dans ses publicités, TellMe rêvait de faire mieux ;-)

 

Le lien de la vidéo de TellMe sur Youtube

La biométrie nuancée par Twitter :-)

Ou plutôt Nuance qui utilise Twitter pour étudier la perception des internautes envers la Biométrie !

En ce mois de Novembre, Nuance présente les résultats d'une étude fort instructive :

  • 80 % des internautes utilisent ... le même mot de passe partout (pas vous, bien sûr)
  • 67 % ont plus de 11 logins (moi, je n'ose pas compter ...)
  • 77 % souhaiteraient une solution biométrique pour sécuriser leur accès

Il semble donc que la biométrie, et notamment la biométrie vocale aient de l'avenir.

Si vous voulez les résultats complets, écrivez-moi.

P.S. : l'autre effet positif de Siri sur l'iPhone 4S ... c'est d'avoir dopé les résultats financiers de Nuance ...

IVONA rejoint le programme NG connect Alcatel

Alcatel a un programme dédié aux technologies de Nouvelle Génération, qui regroupe quelques sociétés d'avenir. Cette initiative industrielle vise à favoriser le développement des nouvelles technologies, en coordonnant de nombreuses actions.

Une vingtaine de nouveaux membres viennent de rejoindre le groupe.

Ivona, les spécialistes polonais de la synthèse vocale, viennent tout juste de rejoindre ce programme, ce qui montre leur dynamisme et la pertinence de leur solution.

Plus d'informations sur les nouveaux membres de NG connect

Et maintenant Siri like sur MacBook

La magie d'Apple c'est de faire parler de ses innovations ! On ne compte plus les articles élogieux (et aussi critiques) sur l'assistant vocal du nouveau 4S. Comme si la reconnaissance de la parole venait d'arriver !

Et voilà Nuance, dont le moteur équipe Siri, qui sort son assistant vocal, mais sur MacBook (on rappelle que Dragon Dictate et Dragon Search existent depuis longtemps sur l'AppStore Iphone). dragon_express_output_options.jpg

Voici donc Dragon Express, bientôt disponible sur le MacStore français, avec des fonctions étendues. Le tout pour 49 $ soient presque le prix d'une version basique du logiciel de dictée vocale (quoique la version MacOSX soit beaucoup plus chère que la version Windows ;-(

Amazon jaloux de Siri ?

Alors que depuis peu le site de Yap annonce l'arrêt de son service de VoiceMail, on apprend que la startup de Charlotte est rachetée par Amazon. Amazon utilisait déjà de la synthèse vocale dans son Kindle, les technologies de la parole sont donc familières eu géant de la vente par internet. Mais on voit mal Yap apporter une simple navigation vocale au Kindle. D'autant que Yap était surtout impliquée dans le speech2text, dès 2007, nous l'avions d'ailleurs découverte en même temps que feu SpinVox ...

Ce rachat augure t'il une avancée d'Amazon dans d'autres services ?

Google aurait peur de Siri ?

Souvenez-vous, il y a quelques années Google annonçait son intention d'apporter des services au mobile et accompagnait cette décision d'une nouvelle approche de l'interface homme machine en pariant sur la reconnaissance de la parole. S'en suivirent le service d'annuaire téléphonique gratuit 1-800-GOOG-411, qui permit à Google d'optimiser son moteur et sa connaissance des attentes utilisateurs.

Tout cela devait déboucher sur les premiers services vocaux en appui iPhone puis sur Android. Et certains analystes y voyaient poindre la suprématie de Google.

Mais voilà que patiemment, Apple avait parié sur la startup Siri (pour 200 millions de dollars) et force est de constater que l'inclusion de ce savoir-faire dans le dernier modèle de son smartphone, le 4S a fait beaucoup parler. Pour retrouver ce qu'était Siri en 2009, la vidéo publiée sur VocalNews] ou celle de l'annonce de la version française

Tellement que voilà Eric Schmidt qui , selon le magazine Ars Technica, revient sur son affirmation devant le Sénat comme quoi Apple n'était pas concurrent : « Je m'étais clairement trompé ... Apple a introduit une toute nouvelle approche dans le secteur de la recherche avec Siri, le dispositif de recherche vocal et le service d'aide embarqué à l'iPhone 4S ». Sa lettre du 21 septembre au Sénat américain est fort instructive ...

D'ailleurs Dan Kaplan, de Twilio dont nous reparlerons, prévoyait récemment le déclin de Google dans un intéressant article de Techcrunch.

La vraie valeur de Siri : devancer Android !

Dans le concert, pardon la cacophonie, autour de Siri ou chacun semble redécouvrir que la reconnaissance vocale existe, voilà un article intelligent signé Jennifer Van Grove.

Plutôt que de stigmatiser les problèmes d'accents ou de s'extasier devant les possibilités, Jennifer analyse le véritable avantage concurrentiel et interroge l'analyste et financier Gary Morgenthaler. Et en déduit qu'Apple a pris 2 ans sur Google en cassant les idées reçues !

Pour vous en convaincre, lisez l'article de Jennifer van Grove sur Mashable

IVONA fait parler les développeurs

Nous avons déjà parlé de cette société polonaise qui performe dans la synthèse vocale, avec des voix bien choisies et adaptées aux subtilités des langues européennes. Voilà qu'ils lancent un kit de développement pour iOS (iPhone et iPad) mais aussi Android, Linux, Meego et Windows Phone 7 en SDK traditionnel mais aussi en version Cloud !

Le programme développeurs donne accès de façon gratuite, pendant 60 jours, à l'ensemble de ces outils.

IVONA est de plus en plus présent dans des offres, serveurs vocaux comme produits embarqués et on peut penser que la contraction du marché (Nuance vient de racheter Loquendo) va leur ouvrir de nouvelles opportunités.

Hommage à un visionnaire : Steve Jobs

En 1987, Apple imaginait l'iPad et l'assistant vocal qui vient d'arriver avec Siri dans l'iPhone 4S.

Et comme le soulignait Barack Obama, quel plus bel hommage que de penser au nombre de personnes qui auront découvert l'histoire de Steve Jobs sur des appareils qu'il a créé !

Do you speak Scottish ?

Juste pour le plaisir, cette méchante critique de la reconnaissance vocale par les écossais ;-)
Souhaitons que la version de Siri sera plus douée ...

Code Factory aide les mal voyants chez AT&T

Mobile Accessibility Lite de Code Factory sera bientôt disponible sur Android et le réseau américain AT&T.

Les fonctions habituelles d'un téléphone (appel, carnet, SMS, alertes, email ...) seront plus accessibles avec le savoir faire de Code Factory spécialiste espagnol des outils pour déficients visuels. Des mouvements de doigt suffisent pour activer l'outil et la synthèse vocale fournie par Nuance.

blind.jpg

iPhone 4s ... S pour Siri ?

La keynote d'Apple est riche d'annonces, même si l'iPhone 5 avec Paiement Mobile n'est pas mentionné.

Car la vraie révolution, beaucoup glosée ces derniers mois, est bien l'Assistant à base de reconnaissance de la parole. C'est finalement toute la force de Siri qui a été ajoutée à la version 5 de iOS, avec une démonstration bluffante (quelques photos sur Engadget).

Winarsky le fondateur de Siri avait d'ailleurs déjà laché quelques confidences ces derniers jours, annonçant qu'Apple arrivait avec une intelligence artificielle bien plus performante que celle de Google Voice.

Pour tout savoir sur ce nouvel assistant, le site de Siri, désormais au look Apple ;-)

Le paiement mobile devient visible ;-)

Et au cas où vous auriez loupé Kwixo ... voici une vidéo :

Nuance rachète Loquendo

Le géant américain de la reconnaissance vocale a profité du 15 août pour annoncer qu'il allait racheter Loquendo, filiale de Telecom Italia et seule société à lui faire vraiment de l'ombre sur son propre territoire.

Cette annonce explique, bien évidemment, que cela renforcera les démarches des deux sociétés, que cela aura de grands avantages pour tout le monde ... mais on voit aussi que l'appétit du géant ne cesse et qu'il sera bientôt en position de monopole.

Plus d'informations dès que possible, en attendant, le communiqué de presse

Une nouvelle voie pour la reconnaissance vocale ?

La revue du MIT annonce que trois universités (Cambridge, Sheffield, et Edimbourgh) se sont lancées dans un projet innovant autour de la reconnaissance vocale.

Ce projet vise à dépasser les limites actuelles, tout en disant bien que Dragon est déjà fort satisfaisant. Avec 10 millions de dollars, l'équipe universitaire s'est fixée trois objectifs :

  • une reconnaissance intelligente en langage naturel, capable d'apprendre à la volée
  • des algorithmes capables de distinguer les locuteurs
  • des applications pratiques

Rien n'est dit sur les mèthodes envisagées, il nous faudra attendre pour voir quelques résultats pointer ...

L'article du Technology Review du MIT

- page 1 de 52