Innovation

AskWiby.png

Avec la profusion des outils, l’unification des canaux est souhait difficile à satisfaire.

Deux entreprises se sont liées pour tenter une approche innovante. WIT Software et ReusableIT proposent de mixer recherche, langage naturel et intelligence artificielle pour simplifier l’accès à l’information. Ils ont baptisé leur offre AskWiby.

Un client peut ainsi trouver une réponse, quelque soit le mode (SMS, email, web …) et dialoguer dans un langage structuré, en anglais et portugais, bientôt en espagnol, français et allemand.

C’est la Faculté de Sciences et Technologie de Coimbra qui a donné naissance à cette approche, ReusableIT étant une de ses spin-off.

Pour en savoir plus : AskWiby

Prosodie choisit VirtuOz

Les agents conversationnels établissent une passerelle entre les univers web et vocaux … Prosodie devait naturellement lancer une offre ! C’est chose faite avec les agents de VirtuOz qui se distinguent par leur avance, traitant plus de 6 millions de demandes clients par mois pour eBay, PayPal, SFR, Voyages SNCF, Fnac.com, L’Oréal, MMA, Banque Accord, Sofinco, Crédit Agricole, Gaz de France…

Une étude récente montre que plus de 80% des gens préfèrent effectuer une simulation de crédit par Internet mais que 90% des mêmes personnes interrogées souhaiteront conclure la transaction par téléphone. Aurélia Giraudier, Responsable d’offres speech et multicanal chez Prosodie, explique que  » Le rebond entre les canaux n’a jamais été autant d’actualité. Si beaucoup d’entreprises sont présentes sur le web et sur le vocal, elles n’ont pas encore véritablement réalisé l’unification des différents canaux. »

« Nos technologies linguistiques et vocales sont extrêmement complémentaires et nous nous sommes aperçus que nos démarches projets respectives étaient les mêmes tant dans l’analyse du contexte client, que dans les phases d’optimisation nécessaires pour atteindre un haut niveau de performance. Nous sommes donc capables de proposer un agent conversationnel unique pour le web et le vocal en quelques mois seulement » ajoute François Chaffard, Responsable marketing stratégique de Prosodie.

Dictée vocale sans fil

Philips passe au sans fil et offre une ergonomie améliorée et un design futuriste pour son outil de dictée.

Déjà pré-annoncé courant 2009, price Philips annonce la sortie du SpeechMike Air, la version sans fil de l’appareil d’enregistrement audio professionnel le plus vendu dans le monde. Le concept du SpeechMike qui connaît un grand succès, comprend, dans un seul appareil, un microphone de dictée, un haut-parleur, un système de contrôle de dictée et un navigateur PC. En plus d’un grand nombre de nouvelles fonctions, le SpeechMike Air frappe par son design : son boîtier élégant mais robuste, les boutons de contrôle plus grands et sa ligne affinée ont été spécifiquement mis au point pour répondre aux besoins des utilisateurs réguliers de dictée. La qualité d’enregistrement a encore été améliorée, faisant du SpeechMike Air l’appareil de référence dans le domaine de la reconnaissance vocale.

speechmike

Le SpeechMike est compatible avec Dragon Naturally Speaking®, le logiciel leader mondial de la reconnaissance vocale de Nuance : les fonctions clés de ce logiciel peuvent être directement contrôlées par un bouton en utilisant le nouveau logiciel de contrôle Philips Speech Control qui est fourni avec chaque SpeechMike. Grâce à des réglages préinstallés par défaut, le SpeechMike est immédiatement opérationnel. Le logiciel Speech Control permet également d’affecter des fonctions spécifiques aux boutons programmables, ce qui permet à chaque utilisateur de personnaliser l’appareil selon ses préférences.

Le design du SpeechMike Air a été influencé par les résultats des dernières recherches en ergonomie. Les mouvements des utilisateurs pendant une dictée ont été analysés en détail : les boutons les plus importants ont été agrandis et positionnés à portée du pouce pour réduire les mouvements au minimum. La dictée elle-même a encore été simplifiée grâce à la fonction « pousser pour dicter » : les fonctions de démarrage et d’arrêt peuvent être contrôlées par un seul bouton, ce qui permet à l’utilisateur de dicter de façon intuitive.

En plus de l’appareil audio, le système SpeechMike Air intègre la station d’accueil SpeechMike AirPort. Cette station d’accueil se connecte au PC et permet de transférer des données et de recharger le micro. Il intègre également le module de réception SpeechMike AirBridge qui gère les enregistrements provenant de l’appareil de dictée, sans fil avec une portée maximale de 10 mètres. Le module de réception SpeechMike AirBridge peut aussi être utilisé sans être connecté à la station d’accueil. Par exemple, le module AirBridge peut se connecter à un ordinateur portable via son câble USB, ce qui permet à son utilisateur de dicter normalement avec son SpeechMike Air et de bénéficier d’une mobilité totale. Le transfert des données est crypté sans erreurs et s’effectue en Bluetooth via un protocole de transmission de données spécifiquement conçu. Si l’utilisateur dépasse la portée de réception du SpeechMike, l’appareil émet un signal vibratoire.

Le potentiel du SpeechMike Air peut être totalement exploité avec les solutions de gestion de dictée numérique SpeechExec Pro et SpeechExec Enterprise ou en intégration avec les systèmes spécifiques sectoriels, par exemple dans le médical ou le juridique. Cette intégration est rendue possible grâce au kit logiciel séparé SDK (Software Development Kit – Kit de Développement Logiciel). Le SpeechMike Air fonctionne comme n’importe quel appareil standard USB, permettant cette intégration facile qui fait la réputation des SpeechMike filaires.

Un nouvel algorithme en reconnaissance de la parole ?

Une collaboration entre université allemande et britannique semble prometteuse pour améliorer la reconnaissance de la parole. L’institut « Human Cognitive and Brain Sciences » de l’université Max Planck de Leipzig et le Wellcome Trust Center for Neuroimaging annoncent en effet un nouveau modèle mathématique qui serait beaucoup moins sensible aux bruits. Notre cerveau sait mieux distinguer la parole des séquences bruyantes temporelles comme l’explique Stefan Kiebel, aussi une analyse prenant en compte les « niveaux temporels » (dans une discussion sur l’été, les lettres SU sont plus susceptibles d’annoncer SUN que SUPER …) doit donner des résultats plus précis. Le défaut réside alors dans les conversations où les acteurs changent de sujet !

La patience s’impose, cette recherche neuroscientifique promet des résultats à court terme, avec des exemples concrets dans … quelques années !

Dialonics et le langage naturel

Dialonics a imaginé un logiciel d’intelligence artificielle capable de dialoguer et de répondre aux commandes d’un utilisateur, quelle que soit sa langue.

Un site immobilier permet ainsi de chercher un bien

Vous cherchez une maison quatre pièces, bord de mer, avec jardin. Sur le site de l’agence immobilière, équipé du nouveau logiciel Nabu Talk de Dialonics, riende plus simple. «Votre budget est de 600.000€? Nabu Talk estassez intelligentpour ne pasbloquer à 600.000 € et vous proposer aussi la maison à 605.000 €», illustre Nicolas Renard, directeur marketing. «Si vous le questionnez surlemontant de la taxe foncière, et enchaînez illico avec laquestion ?et d’habitation??, il sait faire le lien avec la question précédente sur la taxe etdonc, vous répondre sur le montant de la taxe d’habitation.»

Un vrai dialogue avec la machine

Nabu Talk est un véritable cerveau artificiel. Couplé avec d’autres technologies (reconnaissance et synthèse vocales), il apporte aux machines – commandes sur le web, serveurs vocaux, bornes interactives dans les gares et les musées, robots domestiques, ordinateurs de bord des voituresetc.-) une capacité de raisonnement qui va révolutionner nos pratiques. «Qu’il tape sur son clavier ou qu’il parle en langage naturel, l’utilisateur dialogue avec un personnage virtuel comme il le ferait avec un interlocuteur humain», explique Franck Panaget, P-DG de Dialonics. Cela change bien des choses, notamment dans le domaine des jeux vidéos où jusqu’ici, il fallait le plus souvent suspendre le jeu pour dialoguer avec d’autres joueurs en ligne, et s’en tenir à des commandes ultrasimples du type «lance» ou «tire».

Un outil pour tous les petits gestes quotidiens

Née le 7mai dernier, Dialonics est pour le moment hébergée par France-Télécom R & D dont elle est essaimée. Ses cinq dirigeants sont tous passés par France-Télécom. Deux d’entre-eux, le P-DG Franck Panaget et le directeur des opérations, Sylvain Camus, sont diplômés de l’Enssat. «Les applications de Nabu Talk sont très concrètes. Demain, on peut imaginer une interface vocale qui permette à la fois de réguler sa chaudière, baisser ses stores, déclencher l’enregistrement du programme TV de son choix… à la place des multiples télécommandes qui peuplent notre univers», indiquent Thierry Martinez, directeur technique et Vincent Louis, directeur R & D. Si les ambitions affichées restent modestes pour le premier exercice (160.000 € de chiffre d’affaires espéré), Dialonics entend croître pour atteindre assez vite les 500.000 € et recruter sous cinqans une trentaine de collaborateurs.

Connaissez-vous l’ATALA ?

Mardi 23 juin, à la Sorbonne, on célébrait les 50 ans de la recherche en langage naturel avec de nombreux experts mondiaux. Nous devrions vous faire part bientôt de certaines présentations marquantes qui ont été faites à cette occasion.

L’ATALA, ou Association pour le Traitement Automatique des Langues, fondée en 1959 donc, y expliquait que si la linguistique existe depuis Aristote, l’informatique lui a apporté un nouveau champ d’expression.

A découvrir ici : atala.org

Assistant virtuel pour iPhone

TechCrunch nous annonce Siri, pills une startup qui propose un assistant virtuel pour iPhone et Smartphones.

Il est évidemment à base de reconnaissance vocale, seek mais aussi doué pour le langage naturel, viagra 100mg la sémantique et avec une interface de questions-réponses ergonomique. Nova Spivack a écrit un long billet descriptif sur cette application étonnante.

En attendant que l’application iPhone soit disponible (fin de l’été), la voici en vidéo :

Après DeepBlue … Watson : IBM s’attaque à Jeopardy

IBM a dévoilé un programme informatique capable de concurrencer les participants au jeu télévisé « Jeopardy ».

On se souvient de DeepBlue qui avait fini par battre Garry Kasparov aux échecs, mais là le challenge est de taille !

IBM pense être en mesure de présenter un programme comprenant le langage naturel et capable même d’analyser les intonations, pour bien comprendre le sens des questions de l’animateur. Quant à la recherche de la bonne réponse … l’immense bibliothèque qu’est le web devrait aider, mais l’analyse sémantique va être fortement mise à contribution.

Si vous ne voyez pas la vidéo, cliquez ICI

Google cherche à mieux comprendre

Maintenant que l’usage des moteurs de recherche est bien connu, leurs limites se font voir. A l’instar des moteurs de reconnaissance vocale, ils fonctionnent plus en wordspotting qu’en langage naturel.

Aussi Google propose depuis peu, en bas de page, des suggestions associées à la recherche (grâce aux requêtes les plus fréquentes). Nous avons eu ainsi :

Recherches apparentées à : reconnaissance vocale logiciel reconnaissance vocale gratuit, reconnaissance vocale xp, reconnaissance vocale telecharger, reconnaissance vocale microsoft, reconnaissance vocale word, synthèse vocale, commande vocale, reconnaissance vocale linux

Google cherche ainsi à rattraper son retard sur le web sémantique, initié par Exalead, True Knowledge, ou Freebase.

Alertes en langage naturel

Les alertes ne sont pas toujours claires ?

Clever Technologies et Yseop proposent un remède en émettant des SMS personnalisés avec diagnostic et suggestions d’actions, en langage naturel. Car Yseop, spécialisé dans la transmission du savoir-faire, sait ajouter intelligence aux textes générés automatiquement. C’est donc le ton et la forme du message qui s’adaptent aux destinataires.

Comme l’explique Jean RAUSCHER, Directeur Général d’Yseop : « Cet exemple d’application est simple à mettre en oeuvre et apporte une réelle valeur ajoutée aux usagers finaux. Ce partenariat avec Clever Technologies est un véritable accord gagnant/gagnant qui permet aux deux entreprises de proposer une offre unique sur le marché »

Bientôt en vocal ?

Pour en savoir plus :