Adobe innove avec Creative Suite 4

OnLocation, viagra 40mg qui permet le monitoring vidéo dans Premiere, va arriver avec une toute nouvelle fonction : la transcription automatique de la bande son. Le dialogue écrit en texte devient alors accessible pour la navigation, la recherche de séquences …

Ceux qui ont eu la chance de le tester se disent impressionnés.

Windows Mobile 7 … en 2009

Nouveau délai pour Windows Mobile 7, qui ne devrait sortir que dans le second semestre 2009. Cette version qui devrait rivaliser avec l’iPhone et Android, promet quelques améliorations (intégration de Flash, rapidité, multitouch)… et une version très évoluée de la reconnaissance vocale grâce aux équipes de TellMe.

Mais Microsoft n’est pas le seul à annoncer des délais, Palm OS II se fera aussi désirer, on attendait cette mouture au nom de code Nova pour … 2007 !

Un cactus dans votre iPhone

Une application au nom prédestiné ?

Beaucoup de critiques se sont élevées contre l’absence de reconnaissance vocale dans l’iPhone. De nombreuses annonces ont été faites, seule VoiceDial de Makayama existait sur l’iStore, pour 15$ … mais avec un fonctionnement hasardeux !

Cactus, basé sur des travaux de l’université de Carnegie Mellon avec le projet PocketSphinx, propose une solution.

L’application, avec seulement 4,9 Mo en mémoire, permet d’appeler ses contacts vocalement. Il est même possible d’ajouter le mot « mobile » ou « home » pour préciser quel numéro appeler. L’application fonctionnant en local, elle est plus rapide que celles qui font appel à un service en ligne.

Mais voilà, les tests ne semblent pas très concluants. Hormis les bugs acceptables sur une première version (n’essayez pas d’appeler un correspondant qui à un W dans son nom …), l’ensemble est décevant.

Et cela contribue à donner une mauvaise image à la reconnaissance vocale si efficace par ailleurs !

Pour le télécharger gratuitement : iStore

Voice Biometric Conference, London

Les 19 & 20 Novembre, Opus Research organise une nouvelle série de conférences sur la biométrie vocale, au Hilton de Tower Bridge.

Toutes les solutions concernant la banque, le paiement mobile, les services médicaux ou les administrations publiques, seront présentées par les acteurs majeurs du marché, experts et fournisseurs de technologie pour montrer les avantages de ces solutions d’identifications aussi fiables que non intrusives.

La participation pour les 2 jours est à 499 £.

Le programme complet :

Vocal News change de look …

afin de vous offrir un meilleur service, nous avons installé la nouvelle version de Dotclear, plus rapide, plus complète … et en avons profité pour changer de design.

Dorénavant vous retrouverez plus aisément les anciens billets et les tags vous permettront de mieux suivre l’actualité.

N’hésitez pas à nous faire part de vos remarques et bonne lecture !

KapTen le GPS totalement vocal

Aram Hékiminan n’en est pas à son coup d’essai (il a créé Wavecom) … mais là il fait très fort !

Imaginez un lecteur MP3, mignon et discret qui saurait aussi bien vous passer les appels de votre mobile que vous guider dans les rues. Sans changer d’écouteurs, sans regarder le moindre écran (les cyclistes apprécieront), et même sans tout perdre de sa musique (les indications sont suggérées par dessus la musique).

On pourrait croire au gadget, et pourtant le Kapten est un vrai GPS à puce GPS SiRFStar III, doté de 4Go d’espace (dont 1 réservé pour le GPS, les 3 autres pour la musique), Bluetooth 2.0, une prise Micro USB 2.0, une batterie de 5 à 6 heures, le tout dans un joli boîtier de 50 grammes et 74 x 44 x 13 mm. (Oui, bien plus petit que la photo ci-dessous). Côté logiciel, il y a la cartographie TeleAtlas France et les reconnaissance et synthèse de Nuance !

C’est l’oreillette de haute qualité, dotée d’un microphone, dui sera donc l’élément essentiel, pour piloter l’appareil. Car les fonctions vont bien au delà des quelques boutons de contrôle. Et il faut pouvoir dicter son adresse de destination !

Le guidage se fera étape par étape, en passant même par les transports en commun. Le Kapten vous dira quelle ligne prendre, où changer et vous reprendra en charge à la sortie du métro !

Pour les cyclistes, il vous aidera aussi à trouver une station Velib … ou un taxi G7 ! Et si le restaurant vous a plu, il suffira d’enregistrer un Ktag pour mémoriser le lieu voire le partager avec la communauté des K !

Livré avec son logiciel PC / MAC (on apprécie d’ailleurs que les Mac n’aient pas été mis en attente comme trop souvent), il sera possible de le mettre à jour ou d’acheter des cartes de villes d’Europe au prix très avantageux de 5 € (bien moins que le billet d’avion …).

On trouvera le Kapten dès Octobre, pour 179,90 €, dans bien des points de vente, de la Fnac à PixMania ou RueDuCommerce pour le début. Courrez-y …

A moins que l’on ne vous réserve une surprise lors de VocalExpo …

GAudi ?

Nous avons déjà parlé du système d’indexation des vidéos promu par Google sur Youtube.

Ce service a été rendu possible grâce aux recherches du Google Lab, sur GAudi (Google Audio Indexing) et devrait être étendu à d’autres vidéos que les seules actuelles qui concernent les discours politiques de la campagne présidentielle américaine. Un exemple frappant est disponible ICI, sur un discours de Barack Obama.

Des index en jaune montrent les portions de la vidéo contenant le texte recherché, une liste de textes montre la phrase en question.

Tout n’est pas encore parfait … ainsi en cherchant « Czechoslovakia » on trouve des portions sur « tech also but there ». De même le mot « president » est parfois retranscrit « present », l’exemple est ici, dans la vidéo « Barack Obama Q and A from Google employees » !

Mais on peu faire confiance aux ingénieurs de Google pour améliorer rapidement cela …

Nuance se lance dans le médical

Non contente de lancer la version 10 de Dragon Dictate, Nuance annonce la version orienté médical de son logiciel de dictée vocale.

Avec cette version plus rapide (jusqu’à deux fois), un dictionnaire spécialisé et une intégration aux logiciels médicaux courants, cette nouvelle version devrait séduire les médecins et hôpitaux.

Bob Wise, le directeur de la division médicale de Nuance, explique que la forte demande d’optimisation et les besoins de réduction des coûts opérationnels seront les vecteurs d’un rapide retour sur investissement de ces solutions.

Pour en savoir plus : Nuance Healthcare

Les nouveautés à VocalExpo

A 15 jours de l’événement, quelques informations sur les nouveautés qui y seront présentées !

  • APP-LINE présentera sa vision du Vocal 2.0, ou comment le langage naturel change tout.
  • ATOS Worldline : un concept innovant le softphone multimédia que l’internaute utilise depuis son navigateur web, sans installation.
  • DB SCAPE : VocaBase 2.3 et son module de statistiques renforcé. Qui appelle ? Quand ? Combien de temps ? À quel sujet ? Avec ou sans erreurs ? Si oui, lesquelles ? Telles sont les questions essentielles que posent l’exploitation d’un serveur vocal interactif. Avec la nouvelle version 2.3, VocaBase s’enrichit de nouveaux outils facilitant considérablement la configuration et l’exploitation de rapports statistiques sur l’utilisation des services.
  • HOTLINE : Naturalvoice Designer ou comment enrichir graphiquement ses applications sans générer des kilomètres de scripts, et My-Naturalvoice, la fin des mots de passe grâce à l’empreinte vocale.
  • LOQUENDO : une nouvelle version de Loquendo TTS Director, l’environnement complet qui permet une mise au point précise pour obtenir des performances TTS encore meilleures.
  • NMS COMMUNICATIONS & VOICEWAY : Video Access Mobile est l’environnement de développement idéal. Flexible, évolutif et économique il répond aux besoins des solutions de téléphonie mobile vidéo et IP – La Vision CX Video Gateway est conçue pour « relier » les applications multimédia entre le traditionnel réseau PSTN et les plateformes applicatives SIP. Les Cartes CG6565 : La plateforme idéale pour l’optimisation des coûts, l’évolutivité et la fiabilité des solutions vocales et vidéo dans un environnement de télécommunications.
  • NUANCE COMMUNICATIONS : Nuance Mobile lance Voicemail to Text : nouveau service de conversion des messages vocaux en texte Nuance® Voicemail to Text, un service pour téléphones portables de transcription des messages vocaux en texte.
  • PROSODIE : la solution Voice search en reconnaissance vocale permet d’exploiter des fonctionnalités de « push-to-talk »
  • TLM COM ANNONCE: l’arrivée d’une passerelle vers les applications de gestion hospitalière.
  • VOICE CORP : ReadSpeaker, solution Saas (software as a service) qui vocalise un site Internet pour tous ceux qui veulent écouter son contenu, avec les version Enterprise et proReader. VoiceCorp présentera aussi SpeechMachine, un service web on-demand de synthèse vocale qui créé une version audio à partir du texte envoyé.
  • VOICE TRUST : PIN2GO – Basé sur une technologie brevetée, PIN2GO fonctionne comme un coffre-fort pour mot de passes et PINs. Un utilisateur peut stocker sur Internet ses PINs, mot de passes et autres informations confidentielles. Si l’utilisateur oublie un de ses PINs, il peut envoyer un SMS mentionnant l’information désirée depuis son téléphone portable au numéro PIN2GO. Le système l’appelle, contrôle son identité en vérifiant sa voix et délivre l’information souhaitée.
  • VOXPILOT : l’application «OMP Flash Gateway» combinant la communication audio et la diffusion commandée d’un contenu vidéo suite à un appel sur une page web et Voxpilot Open Media Platform (OMP) qui assure la distribution de traitement d’appels et des multimédias basée sur les standards VoiceXML, CCXML, MRCP définis par le W3C et l’IETF.

Dictée vocale en SaaS

Afin de permettre au plus grand nombre d’accéder à la dictée vocale, LED Engineering a eu la bonne idée de proposer le système SpeechMagic en service sur internet.

DicteeOnLine, c’est donc un outil très professionnel de reconnaissance vocale externalisé, quasiment sans installation (pour garantir la qualité, il faut installer des drivers de haut niveau) et avec un coût réduit. La qualité étant le soucis principal de LED engineering, ils conseillent fortement l’acquisition de microphones ou dictaphones et autres Mémo Pads professionnels.

L’autre différence notable avec les logiciels de dictée vocales, c’est qu’il n’y a pas d’apprentissage.

Les utilisateurs peuvent réduire leur temps de frappe, mais aussi travailler de n’importe où, leur code d’accès leur donnant tous les avantages des solutions hébergées.

Orienté médical, le système de Philips contient deux dictionnaires avec les termes propres à la médecine et la radiologie. Un troisième dictionnaire comprend les termes juridiques, les avocats peuvent donc aussi bénéficier de ce service. D’autres dictionnaires sont en cours de développement pour offrir la solution aux notaires, assureurs et journalistes.

Pour en savoir plus :