Reconnaissance vocale sur la TV

Marijn Huijbregts livre une thèse ironiquement nommée SHoUT … à propos de transcription vocale et de télévision. Car le bruit, doctor ennemi numéro un de la reconnaissance vocale est omni-présent en matière de télévision. Cette thèse lui a octroyé le titre de docteur de la faculté de Electrical Engineering, cialis Mathematics and Computer Science de Twente.

Car SHoUT (pour la version néerlandaise de Speech Recognition Research at University of Twente) a démontré sa robustesse face aux parasites sonores et arrive à transcrire les paroles télévisées avec une bon score.

Les démonstrations, la thèse sont disponibles sur le site de Marijn, et on vous conseille sa vision de la transcription, en BD … réaliste et amusante !

Standards, un nouvel acteur

Conviviance, une jeune société française rejoint TLMcom et NaturalTouch dans le domaine de l’accueil téléphonique automatique.

C’est en 2006 que les trois associés issus de l’informatique et les télécoms (Frédéric Lagarrigue, Yassin Djaffar et Henri-Paul Gras) ont conçu Stand Voice, destiné à la gestion des appels qui se situe à mi chemin entre la solution classique d’accueil téléphonique avec décroché automatique et routage intelligent des appels, et la brique de communications et messagerie unifiée.

Ce service fournit plusieurs types de prestations : la prise en charge des appels 24 h/24 et 7j/7, avec décroché automatique (pour limiter la perte d’appels), le routage intelligent en langage naturel (avec le moteur de Nuance). Le temps d’attente éventuel peut être meublé par un message d’information (horaires d’ouverture de l’entreprise, par exemple) ou par un message promotionnel. Enfin une brique de « communications unifiées » donne la possibilité de gérer les appels entrants, sur place ou à distance, grâce à une interface web.

La solution Stand Voice est disponible en plusieurs versions, de la STV 50 (2 voies, jusqu’à 20 entrées, à partir de 6800 € HT) à la STV 1000 (12 voies, jusqu’à 2500 entrées, environ 26 000 €). De nombreuses options sont disponibles dans les « petites » versions, la STV 1000 les intégrant toutes. En mode service, les prix commencent à 180 € HT par mois.

Plusieurs références sont déjà déployées (Marie de Clichy, Palais des Congrès de Paris : 01 40 68 22 22…) et d’autres sont en cours.

Pour en savoir plus : Conviviance.fr ou demandez la démonstration au 01 41 06 40 40 !

Marketing abusif …

Metaphor Solutions a un marketing très dynamique, trop peut être …

Ils se présentent comme le leader des serveurs vocaux interactifs, et lancent 2 applications pour iPhone, SayNDial pour appeler ses correspondants, SayNDrive pour se guider. Au passage ils arguent du fait que cette dernière soit rapidement entrée dans le top des applications payantes « SayNDrive has quickly made it to the top paid application in the Navigation section of the AppStore » (en re-vérifiant, je ne les trouve pas dans les 50 premières …)

Mais derrière la promesse, quelle déception ! Et quelle mauvaise image pour les technologies vocales dans leur ensemble.

Car si le design fleure bon le visual basic des années 80/90, l’usage est encore plus médiocre, quand l’application ne plante pas. Gageons que l’efficacité de Vocalia les fera revoir leur copie …

Le mobile, futur de l’internet

Le Pew Internet Project vient de rendre public son troisième rapport sur le futur d’internet et annonce que le mobile en sera l’outil majeur.

Cette enquête, réalisée auprès de 578 acteurs d’internet et 618 actionnaires, proposait des scénarios pour 2020,

77 % affirment que les smartphones seront l’accès principal au réseau, et 64% pensent que les interfaces seront nettement améliorées, notamment en vocal, d’ici 2020. Si l’internet ne sera pas complètement modifié, il aura encore plus d’impact sur nos modes de vie, avec une progression importante du collaboratif (le fameux Web 2.0) mais aussi les mondes virtuels.

Dans le même temps, on a vu apparaître des outils de eCommerce sur les mobiles. Citons ShopSavvy, sur Google Android, qui scanne les codes barre, SnapTell, qui permet à l’iPhone de chercher des informations produits en les photographiant (une sorte de Shazam visuel fort impressionnant …), Frucall qui appelle un SVI pour saisir le code barre, mais aussi Yahoo oneSearch et Vlingo, qui utilisent la reconnaissance vocale.

Retrouvez l’étude intégrale sur VocalPlace .

Comment Google apprend à écouter ?

Internet Actu publie un intéressant article sur la démarche de Google. Et cite Jim Grass : “La beauté des moteurs de recherche est qu’ils n’ont pas besoin d’être précisément exact”, recipe explique encore Jim Glass à la Technology Review. Quand un utilisateur soumet un mot, viagra 40mg l’algorithme de Google ne fait que le placer dans son moteur et propose à l’utilisateur de choisir le bon résultat ou de recommencer. “Comme les gens ont l’habitude de raffiner leurs requêtes quand ils font une recherche sur le web, ils sont plus tolérants avec l’imperfection des résultats”.

A lire sur la page Internet Actu.

Orange s’intéresse aussi à la vidéo

Orange travaille sur un moteur de recherche vocale pour la vidéo. C’est Didier Lombard, son PDG, qui l’a dit lors d’une interview à l’Express, expliquant notamment que ses ingénieurs ont fait une imprudence … en lui montrant leurs avancées !

 » Nos équipes mettent au point une solution qui retrouve des vidéos en fonction des sous-titres, d’une voix, ou même de la forme du visage. En tapant Nicolas Sarkozy, on trouvera les images du président, mais aussi celles de sa marionnette aux Guignols car le moteur sera aussi sensible aux intonations… « 

Et si l’on avait déjà vu Google sur ce créneau, voilà Cisco qui annonçait récemment aussi Media Experience Engine 3000, un produit capable d’effectuer une recherche vocale dans les vidéos, mais aussi de traduire à la volée les sessions de visioconférence …

L’article de l’Express

Merci monsieur Borloo

Beaucoup a déjà été dit sur les dangers de certains appareils au volant … et de l’intérêt de l’interface vocale pour sécuriser les usages.

Et voilà le ministre de l’Ecologie, Energie et Développement Durable, Jean Louis Borloo, qui annonce la réalisation prochaine d’une étude sur la dangerosité de l’utilisation des GPS et des kits mains-libres au volant.

Le risque serait que cela mène à leur interdiction pure et simple. Heureusement Michèle Merli, la déléguée interministérielle à la Sécurité routière a précisé préférer faire évoluer les mentalités plutôt que de s’engager dans la voie de la répression.

C’est donc une occasion unique pour bien présenter les possibilités offertes par les technologies vocales, leur fiabilité et leur sécurité. Nuance en a profité pour mettre en avant son excellente étude sur les comportements au volant, on aimerai voir d’autres initiatives de ce type.