Speak4it est le nom de cette application de recherche lancée par l'équipe R&D de AT&T, mais disponible uniquement sur l'appStore américain ...
Alors en attendant d'y avoir droit en France, voici la vidéo de présentation :
Par philippe Poux, le dimanche, janvier 18 2009 17:06 dans reconnaissance vocale
Speak4it est le nom de cette application de recherche lancée par l'équipe R&D de AT&T, mais disponible uniquement sur l'appStore américain ...
Alors en attendant d'y avoir droit en France, voici la vidéo de présentation :
Par philippe Poux, le mercredi, décembre 10 2008 14:09 dans Information
Internet Actu publie un intéressant article sur la démarche de Google. Et cite Jim Grass : “La beauté des moteurs de recherche est qu’ils n’ont pas besoin d’être précisément exact”, explique encore Jim Glass à la Technology Review. Quand un utilisateur soumet un mot, l’algorithme de Google ne fait que le placer dans son moteur et propose à l’utilisateur de choisir le bon résultat ou de recommencer. “Comme les gens ont l’habitude de raffiner leurs requêtes quand ils font une recherche sur le web, ils sont plus tolérants avec l’imperfection des résultats”.
A lire sur la page Internet Actu.
Par philippe Poux, le mardi, décembre 9 2008 20:34 dans reconnaissance vocale
Orange travaille sur un moteur de recherche vocale pour la vidéo. C'est Didier Lombard, son PDG, qui l'a dit lors d'une interview à l'Express, expliquant notamment que ses ingénieurs ont fait une imprudence ... en lui montrant leurs avancées !
" Nos équipes mettent au point une solution qui retrouve des vidéos en fonction des sous-titres, d'une voix, ou même de la forme du visage. En tapant Nicolas Sarkozy, on trouvera les images du président, mais aussi celles de sa marionnette aux Guignols car le moteur sera aussi sensible aux intonations... "
Et si l'on avait déjà vu Google sur ce créneau, voilà Cisco qui annonçait récemment aussi Media Experience Engine 3000, un produit capable d'effectuer une recherche vocale dans les vidéos, mais aussi de traduire à la volée les sessions de visioconférence ...
L'article de l'Express
Par philippe Poux, le vendredi, décembre 5 2008 08:09 dans reconnaissance vocale
Fabrice Lacroix, président d'Antidot, donne sa vision des axes de performance du moteur de recherche dans le e-commerce à Neteco. Et il est intéressant de constater qu'il pense que le langage naturel en fait partie, car cela permet enfin à "l'internaute de s'exprimer dans son propre vocabulaire, sans avoir à se soucier des données du site et de leurs modélisations." Mais aussi de le justifier parce que " Ce type de module est une aide à la recherche qui réduit considérablement la notion de multicritère lorsque le modèle de données est très détaillé et précis."
A lire intégralement sur Neteco
Par philippe Poux, le jeudi, décembre 4 2008 12:52 dans Software
L'iPhone, qui a déjà vu plus de 10 000 applications, suscite beaucoup d'intérêt pour les applications vocales. Après Vocalia, Google, Vlingo, Cactus, AdelaVoice, iVoice ... voici Melodis Voice Dialer !
Melodis n'est pas un nouveau venu dans ce monde, ils proposent déjà midomi, une application de recherche musicale qui permet de retrouver une chanson en la fredonnant (ce qui va plus loin que Shazaam).
Basé sur sa technologie Crystal Engine, cet outil serait plus efficace selon Rich Geruson, ancien de VoiceSignal. On peut voir la démo en vidéo, en attendant d'avoir l'application sur son téléphone.
Pour en savoir plus sur MELODIS
Par philippe Poux, le mardi, décembre 2 2008 14:56 dans reconnaissance vocale
IBM aime bien faire des prédictions. Cette année, dans la liste de 5 technologies qui changeront notre vie, il y a le web parlant.
D'habitude, cela prête à sourire ... et pourtant, il semble qu'ils aient raison ! Car si l'on ne voit pas beaucoup pourquoi se passer de notre souris, clavier et écran (à part pour certains handicaps), c'est oublier la convergence du web et du mobile. Ce dernier est de plus en plus connecté, mais conservera toujours une taille réduite (Apple a souffert avec le Newton ...) et c'est là que l'interface vocale avec le web prend tout son sens.
Regardez ce qu'a fait Google avec son application de recherche, il suffit de la tester pour être surpris de son efficacité. Au passage, là où les sceptiques pariaient peu de développements, l'iPhone montre une nouvelle voie de la convergence en dépassant les 10 000 applications (oui vous avez bien lu, la preuve ICI)
Le web vocal, ce sera avant tout l'accès via téléphone, en situation de mobilité, à une information de façon confortable et sûre. Et les solutions existent, les espagnols de VoxWeb qui proposent une vocalisation au téléphone de n'importe quel site web, avec VoxWebTel.
Par philippe Poux, le vendredi, novembre 28 2008 14:27 dans reconnaissance vocale
Selon Vincent Birebent de ZDnet, Google aurait en effet triché pour son application de recherche vocale sur iPhone, en utilisant une API non publiée.
Il est clair que si Apple ne publie pas toutes ses librairies c'est pour pouvoir assurer une qualité maximale et ne diffuser que celles qui ont correctement subi les tests. Google est donc allé un peu plus vite, et on peut féliciter les développeurs d'avoir su tirer partie de fonctionnalités innovantes, au risque de voir leur application ne plus fonctionner lors d'une prochaine mise à jour de l'OS. C'est, selon nous, et toute polémique mise à part, une nouvelle preuve de leur dynamisme, plus qu'une tricherie ...
On remarquera aussi que cette application fait beaucoup parler d'elle, tant par ses avancées (l'usage du capteur de proximité de l'iPhone pour activer la reconnaissance vocale) que pas ses couacs avec les accents anglais (beaucoup d'émotion outre manche, où certains semblent découvrir qu'ils ne parlent pas le même english ...)
Source : ZDnet
Par philippe Poux, le jeudi, novembre 27 2008 08:10 dans reconnaissance vocale
Tim O'Reilly donne quelques appréciations sur la fonction de recherche vocale de Google et pense aussi que c'est l'interface la plus naturelle pour les mobiles. Il ajoute qu'il faut bien voir qu'il n'est pas question de reconnaissance vocale sur le mobile mais bien sur les serveurs de Google ...
Par ailleurs il propose que d'autres fonctions utilisent l'accéléromètre (l'application google attend la voix quand l'iPhone est placé à l'oreille et lance la recherche dès qu'il est remis face au regard), ainsi de l'appareil photo qui devrait se déclencher lorsque l'on place l'appareil face à soi ...
Par philippe Poux, le jeudi, novembre 27 2008 08:10 dans Synthèse vocale
Intéressant article d'InternetActu, le site d'information de la FING, à propos de recherches faites avec la synthèse vocale pour comprendre les comportements.
A lire sur InternetActu
Par philippe Poux, le lundi, novembre 24 2008 06:58 dans reconnaissance vocale
Un titre provocateur ... tiré d'un compte rendu de Jean Michel Billaut !
Ce dernier est en Californie, visite de nombreuses start-up, et nous en fait profiter. Ainsi des hollandais de Q-Go et leur moteur de recherche en langage naturel, qui pourrait remplacer partie des centres d'appels, selon son président, Marcel Smit. Voilà dont un nouvel acteur qui se propose d'aider au fonctionnement des centres d'appels en filtrant, aiguillant, comprenant les motifs d'appels et en cherchant à y répondre, avec une démarche non hiérarchique.
Ce qui est sûr, c'est que les technologies de langage naturel commencent à se répandre, avec de vrais succès, et peuvent apporter des services aux clients. Surtout depuis que l'ergonomie est mieux prise en compte dans ces applications. A ce sujet, on vous conseille le dernier billet du blog SoNear.
Par philippe Poux, le jeudi, novembre 20 2008 08:12 dans Service
Alors que certains pays comme le Canada interdisent le téléphone au volant, le constructeur texan ATX propose à ses clients Ford, Peugeot, BMW, de laisser les conducteurs piloter le web à la voix tout en conduisant.
Browse By Voice est donc un système permettant la consultation d'un moteur de recherche par la voix, en langage naturel, capable d'appréhender les termes spécifiques de la conduite dans un véhicule. L'équipementier pense même bientôt proposer des commandes en langage naturel pour la composition de messages texte et l'envoi de courriels, ou la gestion des réseaux sociaux ...
Par philippe Poux, le mardi, novembre 18 2008 19:34 dans reconnaissance vocale
On en parlait depuis vendredi ... voilà l'application de Google pour l'iPhone. En fait il s'agit de la mise à jour d'une application déjà proposée, mais maintenant vocalisée !
Il faut d'abord valider la recherche vocale dans les préférences, et découvrir que, pour l'instant, c'est seulement en anglais avec une sympathique mention demandant d'utiliser un accent nord américain.
Et les développeurs Google ont bien travaillé, car il n'y a pas de bouton à cliquer, il suffit de porter l'iPhone à l'oreille pour qu'il se mette à écouter. De même, dès que l'on reprend l'appareil face au regard, la recherche se fait. Ce sont les serveurs de Google qui analysent les mots prononcés et effectue la recherche en tenant en compte de la localisation de l'utilisateur. Et quelle recherche !
Car la plupart des tests effectués sont étonnants, même avec un accent pas totalement nord américain. La stratégie de Google avec son numéro gratuit GOOG-411 porte ses fruits et montre bien qu'ils ont fort bien analysé les principales demandes.
Et cela montre, une fois de plus, que le nouveau champ de développement de Google c'est le mobile !
Pour installer l'application il suffit d'aller sur l'AppStore : 
Par philippe Poux, le lundi, novembre 17 2008 06:43 dans Software
Selon le New York Times de vendredi, Google devait sortir une application de recherche vocale sur iPhone. Et cela à échauffé les esprits, et les blogs ... mais restse introuvable ... et Apple très discret ...
Sur ce terrain on avait déjà Vlingo pour le OneSearch de Yahoo, voici donc Google qui propose une recherche basée sur une saisie vocale (le traitement de la parole est fait sur leurs serveurs). Et si l'outil s'avère aussi bon que la vidéo de promotion, ce devrait être un succès.
Par philippe Poux, le jeudi, novembre 13 2008 07:33 dans reconnaissance vocale
Le Paisley Group publie une analyse des services d'annuaires fort instructive.
3 éléments permettent cette étude, notés en pourcentage de précision, en moyenne on a 98,7% pour l'automatisation, 99% pour l'opérateur et 95,7% pour les bases de données. Au final, cela donne 94,7 % des appels qui aboutissent correctement.
Et, pour la première fois, ils ont analysé les fournisseurs de service gratuit, du 1-800-YELLOWPAGES d'AT&T à Goog411 et Jingle. ces derniers ayant seulement 75% environ pour les recherches normales et 95% pour les recherches par catégorie.
On note surtout que l'usage de la reconnaissance vocale est une bonne approche, la précision étant notée à 98,7% ...
A lire ici (version intégrale en anglais)
Par philippe Poux, le jeudi, novembre 13 2008 07:09 dans reconnaissance vocale
Le moteur de recherche Like.com permet de trouver des produits "similaires" grâce à de la reconnaissance d'image.
Menlo Ventures et Crosslink Capital viennent de leur apporter 32 millions de $ pour les aider à se développer ... preuve que malgrè la crise financière les bonnes idées ont de l'avenir. Selon TechCrunch cela montre bien l'importance future des techniques de reconnaissances de formes, de couleurs et de textures dans les images et les vidéos, ainsi que que la reconnaissance vocale dans les vidéos et les fichiers audio pour ce type d'outils dans l'avenir.
Par philippe Poux, le jeudi, novembre 13 2008 07:08 dans Synthèse vocale
IBM et Sun annoncent un Open Document Format Toolkit Union pour promouvoir le format ODF, concurrent du Open XML de Microsoft.
Et le projet est ambitieux puisqu'il prévoit de l'interface tactile, la compatibilité avec tous les formats ... et l'intégration de synthèse vocale pour générer des fichiers MP3 à partir de n'importe quel document. Ainsi il sera possible de faire tourner une présentation en autonome, avec commentaires lus.
"Le fait de pouvoir transformer un document ODF en voix ou en vidéo devrait par exemple favoriser l'accessibilité", explique Alix Cazenave, chargée de mission à l'April (Association pour la promotion et la recherche en informatique libre).
Par philippe Poux, le jeudi, octobre 23 2008 06:58 dans reconnaissance vocale
RCR Wireless publie un long article sur l'activité de Nuance.
Alors que la société digère ses récentes acquisitions, pour 1 milliard de $, elle continue d'avancer avec Verizon et T-Mobile. Notamment dans le marché devenu très concurentiel de la recherche, comme l'expliquait Michael Wehrs, Evangeliste de Nuance, lors de Mobile Internet World 2008.
L'article pointe quelques éléments de la stratégie de Nuance et nous éclaire sur ce que pourrait être son avenir.
Par philippe Poux, le mardi, octobre 14 2008 06:29 dans Software
Surprise en Ukraine, le lancement de la première barre d'outils de recherche en reconnaissance vocale. Cette application fonctionne uniquement pour Internet Explorer, sous Vista, mais c'est une première.
Et ils dédicacent leur travail à Bill Gates qui disait lors de ses dernières conférences que "dans 5 ans on fera plus de recherches vocalement qu'au clavier".
Basé sur l'API vocale de Microsoft, la barre comprend les demandes et retourne les réponses trouvées sur Google via le site web de VoiceSearchBar. Il est conseillé d'adapter la reconnaissance quelque peu, mais les résultats sont assez étonnants.
Une initiative à suivre, le site c'est VoiceSearchBar
Par philippe Poux, le mardi, octobre 7 2008 07:49 dans reconnaissance vocale
Connaissez-vous Knol ? C'est la contraction de Knowledge, et c'est l'encyclopédie en ligne de ... Google !
Et à l'instar de ce qu'a fait Pediaphon sur Wikipedia, voilà que Google ajoute la voix à son offre. Un système permet la lecture ou la récupération du fichier mp3 associé.
Cela montre, une fois de plus, que Google s'intéresse beaucoup aux technologies vocales. L'encyclopédie étant basée sur un modèle publicitaire, on pourrait voir des publicités vocales grâce à la plateforme Dmarc broadcasting acquise récemment.
On attends par contre une intégration du moteur de reconnaissance vocale si bien utilisé dans Youtube pour aider aux recherches ...
Par philippe Poux, le mardi, septembre 30 2008 13:14 dans Software
Voici une application vocale proposant la numérotation vocale pour l'iPhone ... qui mérite le détour !
Vocalia nous est proposé par Creaceed, spécialiste des logiciels Apple. Avec son look HAL, l'ordinateur parlant popularisé par 2001 l'odyssée de l'espace, cette application a aussi un style original.
Mais, surtout, elle fonctionne fort bien. Une fois installée, elle phonétise les noms du carnet d'adresse (ce qui peut être un peu long ...) puis attend que vous prononciez un nom pour le chercher. La version étant américaine, il faut évidemment prononcer les noms comme le ferait un natif de New York ! On attend avec intérêt une version française, les impatients pourront modifier la phonétisation des noms (et là ce pourrait être fastidieux ...).

A l'usage, Vocalia s'avère vraiment efficace ET rapide, même avec un carnet d'adresse un peu bondé. De plus on apprécie l'accessibilité de la fonction, la loupe de recherche du carnet Apple étant assez capricieuse.
Côté ergonomie, on ne peut faire mieux : pas de bouton pour le déclencher, et une simple secousse pour relancer une recherche !
L'application est à seulement 2,99 € sur l'AppStore jusqu'au 18 octobre, après il faudra payer 7,99 ... alors foncez ... c'est ICI !
« billets précédents - page 1 de 2