Isuzu et KDDI donnent la parole aux tachymètres

Isuzu lance l’Internet Digital tachograph, un système télématique pour surveiller camions, bus, etc.

Lancé avec l’opérateur télécom KDDI en 2004, le premier tachymètre de l’ère numérique s’enrichit de fonctions de transfert via un réseau sans-fil mais aussi de synthèse vocale. Cette dernière double l’écran LCD: une voix se fait entendre dès que le conducteur a un comportement qui se traduit par une surconsommation de fuel. Plus de tricherie, moins de consommation d’essence, moins de composants informatiques: le tachygraphe du XXIème siècle est là.

La news de l’Atelier groupe BNP Paribas

ReadSpeaker primé

Readspeaker, qui avait déjà été primé lors de la première édition de VocalExpo, est arrivé en 2ème position sur 30 candidats dans la catégorie « Information » lors des Deutscher Multimedia Awards (DMMA) 2007 ! Cette nomination récompense le service Audio News proposé aux lecteurs du Financial Times Deutschland. Pour ceux qui ne maîtrisent pas l’allemand, vous pouvez le tester sur l’International Herald Tribune.

Mais vous pouvez aussi découvrir la version podcast de ce blog, en cliquant sur l’image à droite de ce billet.

ReadSpeaker a déjà mis en place son outil de vocalisation de sites sur les news de BNPParibas, O’Reilly … mais aussi :

Maison de la France, MyCow, Conseil Général des Hauts-de-Seine, Revue Automobile, Moto Sport Suisse, Vincennes, Bois-Colombes, Portail des élections législatives UMP, Ville de Luxembourg, Chine Informations, Alençon, Le Centre de Gestion des Côtes d’Armor, Gardanne, Claye-Souilly, MSA, Ville de Paris, APCE, Ville de Metz, ZDNet, L’Atelier BNP Paribas, Ville de Lambersart, Marseille, Chalon sur Saône, News.fr, Top Chrétien, Marly-le-Roi, Ville de Castelnau-leLez, Mairie de Rosny-sous-Bois, Communauté de Morlaix, Mairie de Limeil-Brévannes, mail.com, Encyclo’BD, Conseil Général du Val-de-Marne, Médecins du Monde, Leroy Merlin, Planète Jeunes, Noyelles-les-Seclin, Université de Montpellier I Portices, Notre Dame de Gravenchon …

1-800-GOOG-411 primé par WebWare

Vous avez deviné ! Un service téléphonique lancé par … Google ! Lancé l’an dernier, ce service permet la recherche locale depuis un téléphone mobile. C’est la même chose que le 411 (notre 118 xxx), sauf que Google l’annonce comme gratuit et rapide. Les résultats sont envoyés en SMS et la mise en relation est possible.

Le service est en reconnaissance vocale.

Le site de goog411

Voir WebWare

Brevet Microsoft

Microsoft aurait déposé, via l’un de ses chercheurs, un brevet relatif à une technologie de reconnaissance vocale, qui analyse le timbre de la voix de l’appelant grâce à un logiciel spécialisé.

Le 12 juin dernier, un brevet portant sur la reconnaissance vocale qui analyse le timbre de la voix de l’appelant a été accordé à Andrei Pascovici, un développeur collaborant pour l’éditeur.

La voix de chaque appelant est donc enregistrée, puis sauvegardée dans une base de données. Les caractéristiques des entrées vocales sont appliquées à une diversité de modèles acoustiques qui comprennent un modèle générique et un modèle différent pour chaque appelant précédemment identifié. A chaque nouvel appelant, un nouveau modèle est donc créé.

Ainsi, la voix de chaque appelant est segmentée en « morceaux », et le logiciel permet d’identifier une personne en s’appuyant sur les précédents enregistrements.

L’outil pourrait donc être utilisé dans les centres d’appels, voire dans les PC, serveurs et autres terminaux mobiles.

Nuance s’offre Tegic, le pionnier de la saisie prédictive !

Nuance Communications, le spécialiste des applications et des technologies vocales (reconnaissance de la parole, synthèse vocale à partir du texte, authentification du locuteur, etc.), va reprendre la société Tegic Communications pour environ 265 millions de dollars. Jusqu’ici filiale d’AOL, Tegic est le pionnier de la saisie prédictive de texte. Son logiciel T9 est aujourd’hui présent dans plus de 2,5 milliards de radiotéléphones et était intégré dans plus des deux tiers des terminaux commercialisés en 2006. Avec cette acquisition, Nuance confirme sa volonté de devenir un acteur incontournable du marché de la téléphonie mobile, quelques semaines après le rachat de son compatriote VoiceSignal Technologies, société focalisée sur la fourniture de solutions vocales pour le marché des terminaux mobiles (accès à la voix à l’Internet mobile, traduction de paroles en messages textuels et réciproquement, contrôle/commande du téléphone mobile à la voix, etc.).

Nuance, alors ScanSoft, avait signé en 2005 un partenariat avec Tegic en vue de développer une interface utilisateur multimode unique pour téléphone mobile, que l’utilisateur veuille accéder à des services à la voix ou, plus traditionnellement, avec le clavier ou via un écran tactile.

Philips SpeechMagic reçoit le statut Citrix Ready™

Première technologie de reconnaissance vocale à grande échelle recommandée pour l’infrastructure « Citrix application delivery »

Royal Philips Electronics a annoncé aujourd’hui que sa technologie de reconnaissance vocale à grande échelle SpeechMagic a reçu le statut Citrix Ready après avoir passé avec succès le test de vérification qui a démontré la compatibilité des deux systèmes. En remplissant les critères de participation à l’initiative Citrix Ready, Philips a montré sa volonté d’offrir une technologie puissante aux 50 millions d’utilisateurs Citrix dans 180 000 pays. En outre, plus de 5 000 revendeurs Citrix à travers le monde peuvent désormais compter sur une technologie de reconnaissance vocale éprouvée qui permet à leur clients de bénéficier d’une productivité, d’une efficacité et d’une précision considérables.

Robert Thornton, directeur commercial de Philips Speech Recognition Systems, affirme : « l’adoption de SpeechMagic dans le domaine médical atteint une nouvelle dimension, avec des réalisations majeures à l’échelle de villes et de régions. Beaucoup de ces projets exigent le déploiement de la reconnaissance vocale à grande échelle, dans des environnements Citrix. Philips est le premier à faire progresser sa technologie de reconnaissance vocale pour s’intégrer pleinement en environnement Citrix, permettant ainsi à nos partenaires d’intégration de s’adapter rapidement à un marché en mutation ».

Citrix Ready est une initiative de Citrix Systems, Inc. qui vise à aider ses clients à identifier des produits tiers recommandés et éprouvés, afin d’améliorer sensiblement l’infrastructure « Citrix application delivery ». SpeechMagic a réussi le test de vérification, permettant ainsi aux clients Citrix d’avoir confiance en la compatibilité des deux systèmes.

David Jones, Vice-président, chargé du développement pour les entreprises pour Citrix, a déclaré : « Philips et Citrix travaillent étroitement ensemble pour accroître l’efficacité de la documentation dans les organisations utilisant l’infrastructure « Citrix application delivery » améliorant ainsi leur retour sur investissement. Philips a engagé des ressources importantes en adaptant SpeechMagic aux exigences de Citrix et nous sommes impatients de renforcer la présence de la reconnaissance vocale, de la dictée numérique et de la transcription dans la communauté Citrix ».

L’initiative concerne à ce jour Citrix Presentation Server™ 4 (versions 32 et 64 bits), Citrix Password Manager™ 4.5 et Citrix® NetScaler®. L’initiative sera étendue courant 2007 à d’autres produits Citrix.

Recherches full audio vidéo

En s’associant avec PodZinger, try Factiva allie des technologies avancées à un contenu de premier plan pour des recherches audio et vidéo révolutionnaires

NEW YORK, medications le 4 juin 2007 : Dow Jones & Company (NYSE: DJ) vient d’annoncer la conclusion d’un partenariat avec PodZinger, online la première plate-forme multimédia qui permet à ses utilisateurs d’accéder à un contenu audio et vidéo en effectuant une recherche par mot clé. Ce partenariat vise à intégrer un contenu multimédia dans Factiva.com et Factiva iWorks, solutions d’actualité et d’informations économiques de premier plan destinées aux entreprises du monde entier. Dès le mois d’août prochain, les utilisateurs de Factiva pourront accéder en toute facilité à un contenu audio et vidéo comprenant notamment des informations économiques, des interviews et déclarations de dirigeants d’entreprises, des assemblées générales d’actionnaires, des informations sur les produits et encore bien d’autres renseignements essentiels pour leur activité.

Selon eMarketer, pour le seul mois de janvier 2007, plus de 7,2 milliards de flux vidéo ont été visionnés par 123 millions de consommateurs. Et selon AccuStream iMedia, le nombre d’utilisateurs de contenu multimédia devrait augmenter de 30 % par an.

« Les entreprises sont bien conscientes que le contenu multimédia se propage de manière exponentielle », déclare Clare Hart, vice-présidente de Dow Jones et présidente de Dow Jones Enterprise Media Group. « Pourtant, trouver un contenu pertinent peut prendre un temps considérable ; en effet, la plupart des sites multimédia se contentent de proposer quelques métadonnées et n’offrent que les fonctionnalités de recherche basiques pour les contenus audio et vidéo, générant ainsi un trop grand nombre de résultats qui se révèlent bien souvent inadaptés. « 

« Les contenus vidéo et audio jouent un rôle de plus en plus important dans la recherche d’informations et le suivi de l’actualité, en particulier pour les entreprises qui veulent disposer d’une vision globale de leur activité. A travers ce partenariat avec PodZinger, nous réaffirmons notre volonté d’offrir aux entreprises la possibilité d’exploiter tous les avantages des contenus émergents et des technologies du Web 2.0 « , ajoute-t-elle.

Grâce aux technologies de synthèse vocale et de traitement du langage naturel développées par PodZinger, l’offre multimédia de Factiva garantit à ses utilisateurs des résultats de recherche extrêmement pertinents. En outre, cette fonctionnalité intègre Factiva Intelligent Indexing, système d’indexation exclusif, ainsi que l’affichage des résultats sous forme de graphiques, qui permet aux utilisateurs de comprendre et d’exploiter rapidement leurs résultats de recherche. D’après un sondage réalisé en 2006 par PodZinger, les utilisateurs ne consultent pas l’intégralité, mais 15 % seulement d’un fichier audio ou vidéo. En conjuguant les fonctionnalités de Factiva et de PodZinger, Dow Jones propose un outil de recherche multimédia inégalé permettant à ses utilisateurs d’accéder à des extraits de contenu courts et ciblés, correspondant à des termes de recherche spécifiques, à partir desquels il est possible de consulter les sections les plus pertinentes ou l’intégralité de la séquence.

Selon Tom Wilde, directeur général de PodZinger : « Compte tenu du poids grandissant du contenu multimédia dans l’actualité disponible en ligne, il est essentiel de fournir aux utilisateurs un moyen de repérer les éléments qu’ils recherchent dans tous ces fichiers audio et vidéo. Les fonctions de recherche uniques offertes par PodZinger offrent un gain de temps considérable aux utilisateurs de Factiva : ils peuvent facilement écarter les résultats inutiles et accéder rapidement aux informations les plus pertinentes. « 

L’offre multimédia de Factiva comprend : – Un contenu mis à jour en permanence, provenant de plus de 4000 sources (et recueils) d’actualité et d’informations économiques, et plus de 300 000 séquences individuelles. – Des archives d’actualité et d’informations économiques remontant à 90 jours, et comprenant des sources telles que The Wall Street Journal, NPR, CNN, BBC Radio et encore bien d’autres. – Plusieurs langues d’interface : le français, l’anglais, l’espagnol, l’allemand et le russe. Vous trouverez de plus amples renseignements sur les produits offerts par Factiva sur le site factiva.com. Pour plus informations sur Dow Jones, rendez-vous sur dj.com.

VXML 2.1 : nouvelles fonctionnalités !

Le W3C a publié hier une nouvelle définition du VoiceXML, avec la version 2.1 et du SISR (Semantic Interpretation for Speech Recognition). Cette version enrichit l’usage des dialogues popularisés par le VXML 2.0 et ajoute les fonctions de grammaire et scripts dynamiques, tout en conservant la compatibilité avec les versions écrites en 2.0 ! Le SISR, quant à lui, permet de transcrire les commandes comprises par le traitement du langage en requêtes structurées.

Prochaine étape : le VXML 3.0

Pour les technophiles : les pages sur le VXML 2.1

 »Le groupe de travail « Voice Browser » du W3C est piloté par des acteurs comme Aspect Communications, Comverse, Deutsche Telekom, France Telecom, Genesys, HP, IBM, Loquendo, Matsushita, Nuance Communications, Voxeo ou Voxpilot.  »

Les BLOG et le téléphone

Les téléphones mobiles deviennent des instruments clés pour les blogueurs. Des services prisés comme Windows Live de Microsoft, pill Blogger et Yahoo 360 ont introduit des fonctions de blogage par téléphone portable il y a deux ans. Ces services permettent aux utilisateurs de publier des notes courtes et des photos sur leurs « mobiblogs », store instantanément, treat malgré l’incommodité des claviers de téléphones portables.

Récemment, avec la rapide ascension de Twitter, le téléphone mobile a montré qu’il avait le potentiel nécessaire pour se placer au premier plan dans le monde des blogs. Avec Twitter, on peut désormais faire un point rapide sur les activités ordinaires du jour depuis un téléphone portable.

La société Six Apart, qui exploite les services de blogs LiveJournal, Vox, TypePad et MovableType, espère satisfaire encore plus efficacement cette demande.

Le 23 mai, Six Apart a annoncé avoir conclu un accord avec SpinVox permettant aux utilisateurs de LiveJournal d’énoncer les entrées de leurs blogs par téléphone. SpinVox, qui retranscrit les mots grâce à une technologie de reconnaissance vocale, affirme que le système est juste à 97 % et qu’au fur et à mesure, il mémorise les accents individuels. « Le blogage est un très bon produit, mais c’est lorsqu’on peut l’utiliser à partir de n’importe quel téléphone qu’il devient génial », explique Daniel Doulton, cofondateur de SpinVox. A tester gratuitement ICI !

Microsoft entrevoit la possibilité de proposer un service similaire. En mars, la société a acquis Tellme Networks, un fournisseur de système de reconnaissance vocale pour les annuaires et les services clientèle automatiques. A l’avenir, Microsoft pourrait étendre la technologie aux publications de blogs par téléphone. « Ils disposent de services de recherche orale géniaux. Et évidemment, l’oral est un excellent terrain à exploiter en matière de téléphones portables », fait remarquer Phil Holden, responsable du groupe de services Web mobile de Microsoft et lui-même auteur d’un mobiblog lu par un cercle restreint de personnes. « Ça ne m’intéresse pas d’avoir des milliards d’amis », dit-il.