IBM franchit la barrière des langues

Les chercheurs d’IBM annoncent une grande avancée dans la traduction automatique, de l’anglais vers 11 langues (chinois, japonais, français, italien, russe, allemand, espagnol, arabe …)

Ce service baptisé n.Fluent est hébergé afin d’offrir une traduction temps réel sécurisée y compris depuis une application Blackberry.

Ce qui est innovant, c’est que ce logiciel a été développé en mode collaboratif avec quelques 400 000 employés d’IBM au travers de 170 pays et que le système est conçu pour s’enrichir continuellement. A ce jour quelques 40 millions de mots ont été traduits …

Cette nouvelle façon d’impliquer ses collaborateurs est une intéressante initiative qu’IBM propage sur d’autres segments. Les laboratoires indiens ont ainsi amélioré la reconnaissance vocale de l’hindi, langue majeure.

Il sera intéressant de comparer cette approche à celle de Google qui propose à tous les utilisateurs de son service Translate de proposer aussi une meilleure traduction. Quelle est la plus grande force ? L’immensité des internautes, parfois passifs, ou l’enthousiasme de collaborateurs ?

IBM aide les étudiants handicapés

L’Université de Nantes et la société IBM ont signé une convention de partenariat pour favoriser le parcours de formation des étudiants en situation de handicap.

Outre des offres de stages, IBM met à disposition son logiciel d’aide à la transcription à destination des étudiants sourds et malentendants. « La question de l’accès aux contenus des cours pour ces étudiants est un problème que les compétences et la technique au sein de l’Université de Nantes ne permettent pas totalement aujourd’hui de résoudre », explique Stéphane Brunat. » IBM a développé dans ses laboratoires un moteur de reconnaissance vocale. Le but est de pouvoir en faire profiter les étudiants. »

Des étudiants de Polytech’Nantes et de l’Ecole centrale de Nantes travaillent actuellement sur le développement d’une application spécifique qui pourra être utilisé par le Relais handicap de l’Université de Nantes. L’objectif est que ce système soit disponible à la rentrée universitaire 2010. La convention prévoit également des visites de l’entreprise et des conférences de sensibilisation au handicap.

TCM buzz ses 10 ans

Pour fêter ses dix ans, Turner Classic Movies (TCM), la chaîne cinéma de Numericable, fait un buzz viral avec un film.

Sa particularité ? Mettre le prénom des internautes dans la bouche d’acteurs célèbres, Jim Carrey, Al Pacino, Bruce Willis, Jack Nicholson ! Le quart de seconde de célébrité … virtuel. La bande son est fort bien faite … sauf pour certains prénoms, car l’agence (You to You) a préféré enregistrer 500 prénoms plutôt que d’utiliser la synthèse vocale.

Quant on sait que l’on sait adapter les voix de synthèse à des voix d’acteurs, voilà qui est bien dommage.

L’opération se propage malgré tout bien, avec un taux de viralité de 15%, une moyenne de quatre mails transférés et plus de 100000 vidéos vues en 10 jours …

A essayer ici (si votre prénom n’est pas trop exotique …) : TCM

Après l’indexation, le sous titrage

Google avait déjà commencé à indexer automatiquement les vidéos de Youtube en utilisant son moteur de reconnaissance de la parole, voilà qu’ils vont jusqu’aux sous-titrage !

Et cela simplifie nettement le travail des internautes. Car le sous-titrage est un travail fastidieux, de création des textes, de post synchronisation avec la vidéo …

Bientôt proposé à grande échelle, cette fonction va ravir nombre d’utilisateurs. A commencer par les malentendants, mais aussi les étrangers, puisque la traduction automatique n’est pas loin. Le service de traduction de Google assurant déjà 51 langues.

Cet outil sera déployé dans les chaînes à vocation éducative. « Nous voulons nous assurer des retours, à la fois des internautes et des propriétaires de contenus, avant de généraliser ce système  » explique Ken Harrenstien, ingénieur à Mountain View.

La démo en images :

Makro et Acapela pour l’environnement

Une opération de sensibilisation à l’environnement, case orchestrée par l’agence LBI, pour Makro Cash & Carry Belgium a utilisé la synthèse vocale Acapela.

Une initiative verte originale dans le monde de la grande distribution, très consommateur de papier pour l’impression de catalogues.

C’est donc Mr Hibou qui a invité les clients à « sauver la forêt » et à faire passer le mot. Une carte parlante et ludique, qui faisait passer le message environnemental de Makro, a été envoyée à l’ensemble des clients. Mr Hibou s’adressait vocalement à eux pour les inviter à soutenir l’action en s’inscrivant au projet et leur proposait de participer au bouche à oreille en renvoyant cette carte postale à leurs contacts, enrichie d’un message personnel. Le tout lu au destinataire à haute et distincte voix par la synthèse Acapela pour un impact assuré et une attention toute acquise pour écouter le message de Makro.

Chaque client Makro s’est ainsi vu proposer de choisir entre l’édition papier et l’édition en ligne. Avec à la clé, en plus du papier effectivement non consommé, un arbre planté par Makro pour 5 personnes adoptant la version en ligne.

Près de 171 000 visiteurs uniques ont été sur les sites www.sauvezlaforet.be et www.redhetbos.be et 6 522 messages personnalisés de Mr Hibou ont été envoyés pendant l’été.

Au total, ce sont plus de 30 000 inscriptions qui ont été enregistrées, soit 6 000 arbres qui vont être plantés à travers toute la Belgique. Cette première campagne va permettre d’économiser 177 tonnes de papier.

Olympus écoute mieux

Olympus et Nuance Communications annoncent le dictaphone numérique Olympus VN-5500PC doté de Dragon NaturallySpeaking 10 Recorder Edition.

Cet appareil ne se contente pas d’enregistrer, il transcrit directement, annonçant la fin des enregistreurs numériques. La fonction « Dictation Playback » de Dragon permet d’écouter l’enregistrement de la dictée pendant la révision du document. Dragon filtre la plupart des « euh » et autres « hum hum » indésirables, insère virgules et points automatiquement si besoin, et offre des outils d’optimisation intégrés permettant d’accroître la précision de la saisie avec la pratique. Enfin, grâce à son AutoTranscribe Folder Agent, Dragon peut être paramétré pour transcrire les enregistrements vocaux de façon automatique.

Google vocalise ses traductions

Un nouveau pas vient d’être franchi par Google Translate : la vocalisation dans la langue cible.

En effet, si la nouvelle interface vient de passer en javascript, elle ajoute aussi quelques nouveautés … en 51 langues.

La vocalisation, donc, uniquement pour les textes traduits en anglais … évidemment, si le plugin Flash est installé sur votre machine. On notera que cette fonction n’utilise pas la balise audio du standard HTML 5 et l’empêchera de fonctionner sur les mobiles Android et iPhone.

Enfin on appréciera beaucoup l’option « détecter le langage » franchement impressionnante. Quant aux langues à alphabets non romains, ils sont transcrits en phonétique et deviennent lisibles pour les non initiés.

Quant à ceux qui critiquent la qualité de la traduction … ils ont oublié leurs débuts et peuvent participer à l’enrichissement commun en cliquant sur le bouton « proposer une meilleure traduction » !!!

Intel lance un eBook pour déficients visuels

Alors qu’Amazon a été critiqué pour les fonctions vocales de son Kindle (car les éditeurs de livres lus se sentent lésés), se lance aussi sur le marché des outils d’aide aux déficients visuels avec le Reader. La grande différence c’est qu’il ne télécharge pas les livres, il permet de les scanner avec son capteur photo de 5 mégapixels.

Ainsi tout document imprimé devient lisible, sachant que l’acquisition du texte se fait à la vitesse de 120 à 250 mots / minute. Il peut stocker une vingtaine de pages pour traitement, car il faut scanner la page puis reconnaître les caractères (OCR) et conserve jusqu’à 500 000 pages numérisées.

Le Reader sera d’abord diffusé aux USA pour 1500 dollars.

En attendant, le voici en vidéo :

Le mobile diagnostique votre voix

Grâce à la reconnaissance vocale on peut détecter des maladies respiratoires courantes. Le son produit par la toux, sèche ou creuse, permet habituellement aux médecins de savoir si le patient est infecté par un virus ou une bactérie. Les logiciels de Star Analytical Services font le même travail, en évitant une visite chez le médecin ou à l’urgence.

Pour l’instant le prototype fonctionne sur un ordinateur, pas encore sur un smartphone … mais cela ne devrait tarder.

Dans les pays en développement, où la pneumonie est la première cause de décès chez les enfants, ce projet prend toute son importance. Aussi il n’est pas surprenant d’apprendre que la fondation Bill & Melinda Gates leur a octroyé 100 000 $.

Des lunettes de traduction en réalité augmentée

NEC a conçu des lunettes qui permettent de lire en japonais ce qui est dit en anglais ! Lunettes

Les ingénieurs de NEC pensent qu’il era ainsi bientôt possible de converser avec n’importe qui.

Ils ont conçu un logiciel multilocuteur étendu tournant sur un assistant numérique personnel, et des lunettes imaginées en 2005 par Brother, dont l’une des branches est équipée d’un petit projecteur.

NEC a aussi développé « Tele Scouteur » qui permet à un ouvrier de fabriquer un appareil en ayant sous un œil le mode d’emploi, sans avoir à tourner la tête pour regarder les instructions sur un écran voisin.