Une communauté vocale mondiale

Nuance et Genesys Telecommunications Laboratories ont annoncé qu’ils allaient lancer une communauté en ligne pour les technologies vocales : Speech Community. Pour commencer, le site web a été ouvert.

Ce devrait être le lieux d’échanges sur les pratiques, les tests et les ressources. Cette communauté profitera de l’expérience de Bernhard Steimel, qui, au sein de Mind, a déjà lancé la communauté vocale allemande.

Souhaitons que cela aura le même succès qu’en allemagne et saura donner une impulsion à un marché qui pâtit de trop rares initiatives …

Qui se souvient de Lernout & Hauspie ?

Alors que la cour de justice européenne de Luxembourg confirme la condamnation pour « abus de position dominante » de Microsoft, prononcée en mars 2004 par la Commission européenne, avec notamment les plaintes d’Alcatel Lucent et ATT pour violation de brevets de reconnaissance vocale, le procès Lernout & Hauspie va bientôt reprendre en appel en Belgique, et d’autres acteurs (Dexia, KPMG) semblent impliqués … un petit rappel sur une étrange aventure.

Jo Lernout et Pol Hauspie … du rêve au cauchemar ?

L&H a été fondée en 1987 par Jo Lernout et Pol Hauspie, persuadés que les techniques vocales allaient ouvrir un marché florissant. Il faudra 8 ans pour vraiment démarrer et s’introduire en bourse (Nasdaq en premier, puis Easdaq). Basé à Ypres,innovant dans une Belgique attentive, L&H devint la plus belle réussite belge en matière de nouvelles technologies et le pilier de ce que l’on appella la Flanders Valley et encouragea de nombreuses initiatives. Ayant acquis Dictaphone puis Dragon Systems, L&H paria sur les logiciels de dictée vocale. Séduits, Intel, Microsoft et la région Flandres investissent des dizaines de millions de dollars dans l’affaire, la capitalisation boursière atteint 9 milliards de dollars.

Mais en 2000 certains experts commencent à douter des annonces technologiques, alors que les laboratoires les plus réputés n’arrivent pas à approcher les mêmes performances. En parallèle, quelques experts financiers de Goldman Sachs questionnent les résultats financiers. Le Wall Street Journal révèle en août que les revenus annoncés par la filiale asiatique sont au moins doublés fictivement … L’enquête montrera que 45% de l’ensemble des ventes étaient fictives. En avril 2001 les fondateurs et leur directeur général sont arrêtés, pris par le plus grand scandale financier … avant Enron ! 600 millions de dollars de dettes et les économies de 17 000 actionnaires vont s’évanouir.

C’est Scansoft, spécialiste de la reconnaissance optique qui reprendra les actifs, pour 20 millions de dollars, avant de les développer, d’acquérir SpeechWorks puis Nuance, pour justement, se rebaptiser Nuance.

Le cabinet d’audit KPMG, un des leaders mondiaux du secteur, a participé à cette gigantesque fraude pour couvrir les véritables chiffres de L&H, maintenant c’est Dexia qui est poursuivi pour s’être approprié 30 millions de dollars investis par une société asiatique …

Cette aventure montre encore une fois combien la pression de la valorisation boursière, surtout dans les années de la fameuse bulle Internet a pu mener des dirigeants à la fraude.

L’aspect positif c’est que L&H tira fortement les technologies vocales, induisant beaucoup d’initiatives et propageant les travaux des meilleurs ingénieurs. Les anciens se retrouvent aujourd’hui tant chez Nuance que chez TeleAtlas ou les grands opérateurs de Telecom.

Vocalisation de sites … ReadSpeaker avance

ReadSpeaker vient de mettre en place quelques nouvelles vocalisations de site (vous pouvez d’ailleurs écouter ce blog en cliquant sur le bouton AudioFeed sur la droite …)

La Bourse de Tokyo avec ReadSpeaker Lis-Moi en japonais et en anglais (ouf ! mon japonais est trop balbutiant) pour commencer. Les versions française, chinoise, coréenne et espagnole doivent suivre prochainement. Le Conseil Général de la Vendée et la Mairie de Villenave d’Ornon. AXA Santé sur une partie de son site et l’Assemblée de Polynésie française. A noter que l’Assemblée a également adopté la fonction télécharger le fichier au format mp3 afin que les utilisateurs du site puisse réécouter un fichier sur un baladeur mp3 par exemple.

Mimer le langage des signes

Une équipe de recherche parrainée par le groupe IBM a élaboré un programme qui convertit automatiquement le discours oral en langage des signes, mimé par un personnage animé sur écran, a annoncé jeudi le groupe.

Ce système, baptisé SiSi (Say It Sign It, dis-le mime-le), permettra par exemple à une personne qui fait une conférence d’être accompagnée d’une traduction en langage des signes, mimée par un avatar sur écran, a expliqué le groupe dans un communiqué.

SiSi réunit plusieurs technologies: la reconnaissance vocale convertit la parole en texte, qui ensuite est converti en signes, et animent l’avatar.

« Ce n’est pas destiné à remplacer un interprète mais à assurer une traduction quand l’interprète n’est pas disponible ou que la réunion est confidentielle », a précisé IBM.

Le groupe informatique évoque aussi la possibilité de traductions automatiques de programmes télévisés ou de transcription des programmes radios ou encore des messages vocaux, avec un avatar qui apparaîtrait sur l’écran d’un téléphone portable.

Ce projet a été élaboré par des étudiants sélectionnés par IBM pour participer à son nouveau programme de recherche réunissant en Grande-Bretagne des étudiants européens et ses chercheurs. Il a été conçu en partenariat avec la Fédération mondiale des sourds (WFD) qui représente plus de 70 millions de malentendants, l’Université de East Anglia et le RNID (Institut royal pour les personnes sourdes).

La vidéo sur YouTube

Cela peut aussi servir pour mieux se conformer à la législation concernant la télévision … on vous en parle bientôt plus complètement.

Bataille dans l’embarqué ?

Alors que les offres des TomTom, Garmin et autres NavMan progressent, voilà que les constructeurs réagissent !

Les outils embarqués utiles aux conducteurs sont nombreux. Car au delà des GPS, il y a aussi les baladeurs, les kits mains libres de téléphone, les PDA … une pléthore de produits électroniques qui se déploient d’autant plus vite qu’ils deviennent abordables.

Ces outils sont souvent commandés vocalement et tendent à devenir le centre de l’électronique intelligente. L’accès à internet leur donne des fonctions évoluées de recherche météo, information trafic …

Et voilà les constructeurs qui voient leur échapper un pan entier de l’équipement de leurs véhicules ! Certains avaient pourtant bien commencé, en créant des filiales spécialisées (Egery, par exemple, entre PSA et Vivendi) dans les années 2000 (trop tôt ?)

Aussi, sur les nouveaux modèles, voilà un grand retour de plates-formes communicantes intégrées, le Carminat de Renault, le RT3 de Peugeot, OnStar chez GM, le iDrive (tiens un préfixe qui rappelle une autre marque …) chez IBM, le Blu&Me de Fiat et Microsoft … Et chaque système propose ses services étendus, de la simple lecture d’emails à l’information géolocalisée, qu’elle soit touristique ou d’urgence.

De belles batailles en perspective … propices à la créativité !

Nissan innove

Au Salon automobile de Francfort, Nissan a présenté un prototype de véhicule qui surveille son conducteur !

Un système qui analyse le visage du conducteur permet de détecter fatigue et manque de concentration (pour toutes les raisons … y compris l’ivresse !).

Là ou d’autres font souffler dans un alcootest pour décider du démarrage, Nissan apporte une sécurité active, même sur route. Car un conducteur sobre peut aussi tomber de fatigue … une caméra analyse ses expressions, ses clignements d’yeux, et l’alerte vocalement avant de tirer la ceinture de sécurité.

Plus besoin donc d’avoir un passager pour se faire houspiller au volant !

On regrettera que ce système ne propose pas encore de soutenir une conversation, excellente méthode pour éviter la somnolence.

Un SVI pour payer son taxi ?

A l’heure où la norme NFC se développe (on a déjà parlé de McDonald avec NTT DoCoMo au Japon), ou VoicePay propose le paiement par authentification vocale (on en reparle bientôt, une démo est disponible à Paris) … voilà un service vocal pour payer son taxi !

Journeypay associé à Lloyds TSB Cardnet et Planet Payment annoncent la sortie d’un service nommé BuyVoice sur tout le territoire anglais. Ainsi les taxis anglais peuvent accepter les cartes Visa, MasterCard, Maestro ou American Express grâce à leur téléphone mobile.

C’est un serveur vocal interactif qui leur permet de dicter (ou taper en DTMF) les informations nécessaires à la transaction. Ce service a été testé avec succès en janvier à l’aéroport d’Heathrow, puis avec Mantax Radio Taxis, sur Manchester.

Par contre ils sont discrets sur les aspects techniques … on investigue pour savoir qui fournit la reconaissance vocale … à suivre …

La Newsletter ForumAtena est arrivée !

Que vous soyez intéressés par l’intelligence économique, la sécurité subjective et objective ou les technologies vocales (bien sûr !) … la newsletter N°4 est là pour vous apporter un éclairage !

Téléchargez-la directement !

Lecteurs du Nord, réjouissez-vous, et prenez date ! Le 6 décembre, 14h00 à 18h30, le forum Atena animera une rencontre autour de la « certification des technologies et des personnes, conformité et certification des organisations » à Telecom Lille1. On en reparlera sous peu … mais ceux qui veulent déjà s’inscrire sont priés de se faire connaître auprès de Martine Houlbert.

Annuaire vocal … encore !

Call Genie vocalise les recherches

Call Genie, spécialiste canadien des technologies vocales, a signé un accord avec R.H. Donnelley, portail téléphonique online, pour apporter ses solutions EVD au service téléphonique gratuit de Donnelley : 1-800-CallDex.

Donnelley s’apprete à tester le service sur 4 villes : Denver, Phoenix, Spokane (sans jeu de mot !) et Tucson.

Un nouveau service qui vient compléter la liste des services de renseignement vocalisés outre-atlantique :

En France, seul France Telecom propose un annuaire en reconnaissance vocale, le 118 710.

Microsoft n’est plus aphone !

Microsoft était très discret sur les technologies vocales. 2007 semble être l’année du changement ! La dernière version de son système d’exploitation, Vista, incorpore enfin reconnaissance et synthèse vocale, popularisant ces technologies.

En Mars, Microsoft a racheté TellMe, bien connu dans les services de recherche mobile, pour se positionner dans la bataille des annuaires vocaux qui s’annonce.

Maintenant c’est autour des serveurs vocaux, avec la nouvelle plateforme Speech Server 2007 et le béta test de Exchange Server 2007 avec des fonctions vocales.

Enfin, l’alliance nouée avec Nortel fin 2006, devrait commencer à porter ses fruits, si l’on en croit les déclarations des responsables de ces sociétés …

Ian Jacobs, analyste chez Frost & Sullivan, pense que Microsoft doit maintenant promouvoir les technologies vocales dans de nouveaux segments et a le potentiel pour aller aussi loin qu’ils le souhaitent !