L’hégémonie de Nuance

Nuance, le géant américain des technologies vocales, s’est formé grâce à la vision du président de ScanSoft, leader des OCR, par rachats successifs en commençant par les actifs de feu Lernout & Hauspie puis SpeechWorks et Nuance (dont le nom fût conservé). Le dernier rachat important, la division Speech Recognition Systems de Philips a eu lieu en octobre 2008 pour 96 millions de $ et donne à Nuance une position dominante, particulièrement sur le domaine médical.

Loin derrière on trouve Microsoft … et voilà que la justice américaine enquête sur Nuance pour vérifier si les règles antitrust sont respectées.

Ironie qui doit bien faire sourire chez Microsoft !

Vocalia innove

Et voilà Vocalia 2.0 sur l’App Store … une version améliorée qui ne se limite plus à la recherche de contacts !

L Vous pouvez maintenant piloter la musique, en cherchant le morceau ou l’artiste vocalement, mais aussi les signets Safari. Bref les avantages du 3Gs pour tous les iPhones et autres iPod Touch …

Coté technique, un capteur de présence aide Vocalia à mieux vous entendre dans les environnements bruyants, ce qui n’est pas rare quand on se déplace.

Enfin, pour aider à tout comprendre, une loupe affiche une aide … que j’avoue ne pas avoir compris du premier coup 😉

Afin de séduire de nouveaux utilisateurs Creaceed propose cette nouvelle version à seulement 2,99 EUR (au lieu de 4,99 EUR) pour une durée limitée.

A télécharger sur l’AppStore

Logistique simplifiée

Spécialiste de la logistique, TAKE propose une solution main libres avec de la reconnaissance vocale.

L’offre GSI Voice (Gemini Simplified Interface) permet de piloter la base Oracle vocalement, sans développements complexes. Warren Sumner, le directeur général, explique que cela simplifie grandement les process, sans modifier l’infrastructure informatique et le tout en 36 langues. Le principal problème est de bloquer le bruit ambiant, mais il assure que les nouveaux mobiles apportent une solution efficace.

Pour en savoir plus :

Transcription … du nouveau !

Nuance se lance dans la transcription avec Jott et Yap annonce un accord avec ReQall !

Jott, précurseur des services de transcription en texte des messages dictés (mémos, SMS, pense-bête …) , vient d’être racheté par Nuance.

Nuance accroît ainsi son portefeuille de services adaptés aux mobiles, fournis en API aux principaux opérateurs.

Quant à Yap, qui avait aussi fait quelques annonces dans ce secteur (nos billets ici et ), équipe l’offre de MyCaption, viennent d’être choisis par ReQall pour son service de rappel de mémos.

ReQall étant le grand concurrent de Jott, on voit que le marché s’active outre atlantique !

Creaceed livre son propre SDK

Creaceed, qui délivre la meilleure application vocale de l’iPhone, Vocalia, lance carrément son propre kit de développement pour motiver l’usage des technologies vocales.

Avec un modèle multi-locuteurs, les modèles anglais, français et allemand, un phonetiseur et quelques astuces, ce SDK devrait favoriser l’apparition d’applications intéressantes.

Cette démarche montre que les développeurs avancés peuvent non seulement proposer leur logiciel mais aussi participer à l’écosystème de l’iPhone …

Pour en savoir plus : CeedVocal

Robot chinois

Les robots ne sont pas l’apanage du Japon !

A l’université Kunshan à Tainan (sud de Taiwan) les étudiants ont développé un robot domestique capable de reconnaissance vocale et d’effectuer des tâches complexes. C’est le robot ménager intelligent qui retient l’attention des visiteurs. Le département affirme que le caractère unique de ce robot provient du fait qu’il associe deux technologies majeures : la reconnaissance vocale et la capacité à effectuer des tâches complexes.

Le robot se déplace via à un système de positionnement qui lui permet de scanner son environnement pour se repérer. Un système de reconnaissance vocale lui permettant de retrouver dans sa base de données le mot clé le plus proche de celui qu’il a entendu. Il peut en réponse effectuer des tâches très complexes telles que servir une tasse de thé, récupérer et livrer un journal sur un plateau, etc.

De nouvelles fonctionnalités devraient prochainement être développées par les industriels qui se sont beaucoup intéressés à ce robot et qui sont en discussion avec l’université pour monter des partenariats.

Après Wizzgo … MySkreen ?

Alors que les offres légales de téléchargement se font attendre, que la loi Hadopi se précise et que Wizzgo a disparu (les juges du tribunal ayant oublié de poursuivre les fabricants de magnétoscopes), voilà MySkreen qui débarque dans le paysage de la vidéo à la demande !

Il s’agit de retrouver, voir et revoir les programmes diffusés par la TV 1.0 sur les offres 2.0, un peu comme TV à revoir ou Hulu (superbe site inaccessible depuis notre bonne vieille Gaule.

La grande différence c’est que ce portail recense la plupart des services VOD avec une interface très « grille d’horaires ». Mieux son fondateur Frédéric Sitterlé annonce la prochaine intégration de contenus indéxés en reconnaissance vocale.

C6PO dans les SmartPhones

Depuis Star Wars on sait qu’il faut un droïde de protocole pour comprendre les nombreuses langues de la galaxie.

La société Sakhr (qui vient de racheter DialDirections) propose d’avoir le votre dans votre smartphone, qu’il soit Blackberry ou iPhone. S’il ne parle pas encore le klingon, il assure la traduction anglais arabe.

Il suffit de prononcer une phrase pour que le logiciel traite l’information par reconnaissance vocale puis traduise et prononce en synthèse vocale le résultat.

Le service est réservé au département américain de la défense … on aimerait l’avoir aussi !

La preuve en vidéo (cliquez ici si la vidéo ne s’affiche pas) :