VocalNews

Keyword - langage naturel

Speereo ?

Vous avez un Assistant Personnel et un Dictaphone ? Il vous manquait le lien entre les deux !

C'est ce qu'a compris Speereo avec son Voice Reminder. Son directeur technique, Mr Maleev explique que les logiciels de gestion d'agenda foisonnent tout comme les assistants personnels ... mais utilisent peu les capacités des technologies vocales. Or le langage est l'interface la plus naturelle !

Speereo permet donc de prendre des rendez-vous vocalement, de rechercher dans son agenda et de réécouter ses propres mémos vocaux.

On peut le tester 15 jours :

Nomination chez Acapela

Lars-Erik Larsson, nouveau Directeur Général d’Acapela Group.

Mons, Belgique – 6 Décembre 2007 – Acapela Group, acteur mondial dans le domaine des solutions vocales innovantes, est heureux d’annoncer la nomination de Lars-Erik Larsson au poste de Directeur Général.

La nomination de Monsieur Larsson - Vice-président Directeur Commercial d’Acapela depuis 2004 - en tant que Directeur Général est effective immédiatement. Il remplace Vincent Fontaine, qui a décidé de poursuivre ses activités dans un autre domaine.

Le nouveau Directeur Général apporte plus de 20 années d’expérience opérationnelle à la société, qui est actuellement l’un des acteurs les plus innovants dans le secteur de la synthèse vocale. Précédemment Vice-président Directeur Commercial du Groupe et Directeur Général d’Acapela Suède, Lars-Erik a pour ambition de continuer à développer la société à l’international.

Lars-Erik Larsson a à son actif de solides résultats dans le secteur de l’informatique, avec entre autres des collaborations pour Unisys et GlobalOne. Il a rejoint l’industrie de la synthèse vocale en 1999 en tant que Directeur Senior de L&H et Babel, où il était en charge du développement de la société en Scandinavie, ainsi que de la gestion des opérations commerciales et marketing dans cette région.

“Depuis la fusion il y a 4 ans et la création du groupe, Acapela s’est positionnée comme leader sur le marché de la synthèse vocale. La société propose une gamme de solutions vocales de très haute qualité, couplée à un large portefeuille de langues, qui permettent de mettre en place des interfaces vocales naturelles et porteuses de sens », commente Lars-Erik Larsson. « Je suis particulièrement heureux de poursuivre ce challenge et de continuer, avec toute l’équipe d’Acapela, son développement au niveau mondial »

Cette nomination représente une étape importante pour Acapela qui renforce plus que jamais sa position de leader novateur sur le marché de la synthèse vocale.

''Acapela Group, 1er groupe européen dédié aux solutions vocales multilingues, est entièrement dédié au développement et au déploiement d’interfaces de langage naturelles. Les solutions vocales d’Acapela Group sont déjà déployées dans de nombreux services et applications: portails vocaux, messagerie unifiée, centres de contact, web parlant, jeux interactifs, logiciels ludo-éducatifs, programmes de e-learning, outils pour l’accessibilité, systèmes de navigation embarquée etc.

De nombreux clients et partenaires lui ont déjà fait confiance au fil de leurs projets vocaux: Alcatel, Apoll, AssistiveWare, Atos Origin, Avaya, S.E.B., Bosch Blaupunkt, Cegetel, Daimler Chrysler, Dolphin, Don Johnston, Handitek, Harman Becker, Imagetalk, Intervoice, Kirusa, Klett, Magneti Marelli, Navteq, Once, Phoneticom, PSA Peugeot Citroën, Telia, Telefonica, Temic, Tieman, Toby Churchill, Scandis, Sensory Software, SFR, Siemens, Vocalcom, Voxtron, etc.''

Le Langage Naturel ... simplement

Alors que tout le monde s'accorde sur le fait que le langage est plus efficace que le DTMF ... on constate que ces services vocaux sont encore longs et difficiles à mettre en œuvre et réservés aux grands budgets.

SoNear se propose de faciliter le passage à la reconnaissance vocale. Et propose un générateur de portails vocaux « Dial’n Speak » automatisant la mise en œuvre du langage naturel.

Il suffit de dessiner la logique de dialogue, saisir quelques exemples de réponse à un prompt, le moteur SoNear génère automatiquement les réponses possibles et une application vocale prête à l’emploi, compatible avec tous les moteurs de reconnaissance vocale du marché. Ainsi le maquettage d'une application peut se faire en quelques journées, là où, d'habitude il faut des semaines.

De plus Dial’n Speak enrichit automatiquement le modèle avec les phrases non reconnues simplifiant ainsi grandement la mise au point. Le langage naturel devient accessible à toute entreprise sans moyen considérable et quelle différence pour l’accueil client !

Dubai traque la pollution

Les solutions reconnaissance de la parole et d'authentification de Nuance permettent aux officiers de l'environnement de la municipalité de Dubaï d'enregistrer des violations à travers la ville de Dubaï en langage naturel.

Ce nouveau service permettra aux officiers d'application de municipalité de Dubaï d'enregistrer rapidement et commodément les infractions, réduisant le temps entre l'offense et l'émission d'une amende. Le logiciel de vérification confirme l'identité d'un officier de municipalité de Dubaï, en utilisant les caractéristiques uniques de leur voix. "le nouveau service éliminera les retards constatés avec les méthodes adoptées jusqu'ici. Automatiser le processus en employant des solutions de la parole optimisera l'efficacité" a dit Hussain Nasser Lootah, directeur général de municipalité de Dubaï.

Langage naturel

Mener une conversation avec un ordinateur ... le rêve de beaucoup de chercheurs.

Selon Nina Petukhova, scientifique au Trapeznikov Institute of Management Problems de la Russian Academy of Sciences, et fondatrice du projet, l'innovation n'est pas dans la reconnaissance vocale, qui existe depuis bien longtemps, mais dans le logiciel et le matériel utilisés, qui permettent de proposer une réelle interaction entre l'homme et la machine.

Un système de communication intelligent comprend le langage naturel. Capable d'écouter et de répondre pertinemment à son interlocuteur, il est basé sur la reconnaissance vocale et la voix de synthèse, et passe par l'identification de mots-clés pour fournir une réponse appropriée. Automatique, il est disponible 24 heures sur 24, sans aucune interruption. D'où sa possible application dans le secteur de la réservation de services, des boîtes vocales et des services d'assistance.

Un logiciel interactif

"Nous avons dû fournir une base de données à la machine, contenant des réponses types aux questions posées. Nous avons également enseigné au système à obtenir certaines données de la part de son interlocuteur sur le mode de l'interactivité", explique-t-elle. Ainsi, le système, autonome, peut guider la personne qu'il a au bout du fil selon les données préalablement échangées. Un client souhaitant obtenir une date de départ se verra demander par la machine le jour, voire le siège souhaité dans l'avion. Selon les responsables du projet, le système se distingue également par sa capacité à reconnaître les mots-clés, ce, malgré le grand nombre de grains de voix, d'accents et d'intonations différents des personnes au bout du fil.



Un service fiable en permanence

Cependant, le système redirige une personne vers un interlocuteur humain si elle s'exprime de manière trop indistincte. Lors de la conversation, sur la réservation d'un billet d'avion pour reprendre l'exemple précédent, le dispositif répète ou pose sa question en d'autres termes en cas de mauvaise compréhension de la réponse du client. Selon les fondateurs du projet, il devrait fournir un service de renseignement plus fiable et pertinent que les logiciels de réservation automatique ou les services Internet, qui peuvent ne pas être accessibles. Le tout, sans subir les aléas de l'humeur ou l'indisponibilité en fin de semaine d'un correspondant humain.

Source : l'ATelier BNP paribas

Silvia parle avec intelligence !

Du nouveau dans les avatars intelligents et doués de parole !

Cognitive Code propose un logiciel baptisé Silvia, pour Symbolically Isolated, Linguistically Variable, Intelligence Algorithms), qui peut être intégré dans un ordinateur, un téléphone ou un jouet. Et son créateur, Leslie Spring, assure qu'elle réponds après avoir analysé les questions.

On ne sera pas surpris d'apprendre qu'elle aime Star Wars, 2001, l’Odyssée de l’espace (ou HAL montrait la face sombre des ordinateurs, avec un jeu sur IBM ...), mais rêve de passer avec succès le fameux test de Turing !

Silvia en vidéo

Ce qui est intéressant là, c'est que nous avons à faire à de l'analyse de langage naturel et non de mots clés, comme Alice et Jabberwacky.

Multi OS (Windows, Mac OS-X, Linux, BeOS (tiens, il y a encore des développements en Be ?), Solaris, Windows Mobile ...), fourni avec un studio de développement ... on devrait en entendre reparler rapidement !

Mimer le langage des signes

Une équipe de recherche parrainée par le groupe IBM a élaboré un programme qui convertit automatiquement le discours oral en langage des signes, mimé par un personnage animé sur écran, a annoncé jeudi le groupe.

Ce système, baptisé SiSi (Say It Sign It, dis-le mime-le), permettra par exemple à une personne qui fait une conférence d'être accompagnée d'une traduction en langage des signes, mimée par un avatar sur écran, a expliqué le groupe dans un communiqué.

SiSi réunit plusieurs technologies: la reconnaissance vocale convertit la parole en texte, qui ensuite est converti en signes, et animent l'avatar.

"Ce n'est pas destiné à remplacer un interprète mais à assurer une traduction quand l'interprète n'est pas disponible ou que la réunion est confidentielle", a précisé IBM.

Le groupe informatique évoque aussi la possibilité de traductions automatiques de programmes télévisés ou de transcription des programmes radios ou encore des messages vocaux, avec un avatar qui apparaîtrait sur l'écran d'un téléphone portable.

Ce projet a été élaboré par des étudiants sélectionnés par IBM pour participer à son nouveau programme de recherche réunissant en Grande-Bretagne des étudiants européens et ses chercheurs. Il a été conçu en partenariat avec la Fédération mondiale des sourds (WFD) qui représente plus de 70 millions de malentendants, l'Université de East Anglia et le RNID (Institut royal pour les personnes sourdes).

La vidéo sur YouTube

Cela peut aussi servir pour mieux se conformer à la législation concernant la télévision ... on vous en parle bientôt plus complètement.

Zantaz archive aussi la voix

Après avoir inventé le "tiers d'archivage", Zantaz se lance dans le vocal !

La nouvelle version du Digital Safe intégrera les technologies de traitement du langage Autonomy, sa maison mère. C'est le système IDOL Speech de la suite IDOL (Intelligent Data Operating Layer) qui sera la base des traitements de la parole.

Ceci afin de conserver les conversations, mais après en avoir effectué une analyse fine et sémantique ... le tout sur 100 langues.

Le service actuel d'archivage de Zantaz, Digital Safe, conserve des emails, pièces jointes et autres documents à la cadence de 1 milliard de nouveaux messages tous les 2 mois ...

TLM Com enrichit son offre avec Telisma

TLMCom, labellisée ANVAR OSEO, présente de nouvelles évolutions majeures de ses solutions de traitement automatique des appels téléphoniques grâce au moteur de reconnaissance vocale de Telisma. Grâce au partenariat technologique les solutions Wel’Com, (opératrice virtuelle) et Wel’Voice advanced, (serveur vocal interactif évolué) s’ouvrent à de nouvelles opportunités d’applications et à de plus gros volumes de traitement des appels entrants.

L’intégration de ce nouveau moteur accroît les performances de Wel’Com et apporte différentes fonctionnalités pour la gestion des appels interentreprises, le traitement des VIP ou encore la gestion de planning d’appels (assistante virtuelle). Ces évolutions sont tout particulièrement adaptées à la gestion d’annuaires importants, domaine dans lequel la qualité de la reconnaissance du moteur de telisma permet une hausse significative du taux de transfert. Ces résultats sont notamment obtenus grâce à teliSpeech le moteur nouvelle génération de telisma :

  • Le détecteur bruit/parole qui gère les ambiguïtés possibles entre une pause et une fin de phrase
  • Le filtre de bruit qui garantit un haut niveau de reconnaissance même dans un environnement d’usage particulièrement bruyant (appel d’un mobile dans la rue ou en voiture).
  • Le "noise catcher" qui repère et rejette les bruits d’ambiance ou d’arrière-plan.
  • Le décodage à la volée qui accélère le temps de réponse à l’utilisateur.

Le support de Telisma sur des projets innovants permet également à TLM Com d’étoffer le portefeuille d’applications de son serveur vocal interactif évolué. En effet, la fonctionnalité de langage naturel, associé à la reconnaissance alpha numérique du moteur de telisma, permet à Wel’Voice de s’affranchir des barrières de langage et de traiter ainsi une série de chiffres et de lettres - plaque d’immatriculation, numéro de carte bancaire, identifiant... – de manière très précise. Cette faculté donne à TLM Com les moyens de proposer aux centres d’appels des services personnalisés encore peu ou pas traités par la reconnaissance vocale.

François Cure-Durif, Directeur Technique et cofondateur de TLM Com annonce que ce partenariat apporte de nouvelles perspectives, autant dans l’enrichissement de solutions éprouvées que dans la création de nouveaux produits. «Nous affirmons ainsi notre volonté de maintenir un rythme élevé de développements de projets innovants pour démontrer la richesse et la fiabilité des solutions fondées sur la reconnaissance vocale».

Langage naturel

Mémorisez cette icone ... vous risquez de la revoir souvent !

Powerset capitalise sur de nombreux travaux, dont ceux du fameux PARC (si, vous savez, l'ancien labo de Xerox toujours pionnier, inventeur du mulot ...) pour extraire le sens d'internet ! C'est un moteur de recherche sémantique, capable de comprendre aussi bien les requêtes que les pages indéxées !

Avec deux limites : la qualité sémantique du texte écrit ... et la langue !

Vidéo sur YouTube ... qui aurait mérité une petite démo !!!




"Le challenge principal est d'amener le système au point où les internautes pourront utiliser Powerset et en apprécier la précision, même si notre technologie n'est pas encore tout à fait au point", ajoute Barney Pell.

Plus d'infos ?

Collection d'été chez Acapela

Acapela Multimedia 6.01, disponible sous Windows – y compris Vista – et sous Mac OS X avec la même interface de programmation, permet aux développeurs d’intégrer la synthèse de la parole et de vocaliser, dans les secteurs de l’accessibilité, de l’éducation et du multimédia, de nombreuses applications telles que lecteur d’écrans pour déficients visuels, aides à l’apprentissage dans les écoles, présentations multimédia etc.

Grâce à cette nouvelle version, la famille des voix disponibles s’agrandit avec l’arrivée du néerlandais Max, de l’anglais Peter, de l’hispano-américaine Rosa ainsi que de Louise, la première voix québécoise d’Acapela.

Toutes les langues proposées par Acapela bénéficient aussi des dernières mises à jour, et plus particulièrement le néerlandais, le française, le suédois et l’anglo-américain, pour une qualité optimisée en permanence.

Acapela Multimedia 6.01 est la solution idéale pour toutes les applications Windows ou Mac qui souhaitent rajouter la dimension parole à leurs fonctionnalités et à leurs interfaces. Acapela Multimedia 6.01 fonctionne également avec l’API Microsoft SAPI et l’API Apple, Speech Manager.

Acapela Telecom 6.1, disponible sous Windows et Linux est la dernière version du serveur Acapela Telecom permettant l’intégration de la parole dans toutes les applications multicanales téléphoniques et web.

Acapela Telecom 6.1 est destiné aux développeurs et intégrateurs dans les domaines du serveur vocal d’information, des centres de contacts, des annuaires téléphoniques, de la communication unifiée, de la vocalisation des sites web, du serveur d’alarme, du standard automatisé et, de manière générale, dans toutes les applications nécessitant la distribution d’information audio à un grand nombre d’utilisateurs simultanément.

Acapela Telecom 6.1 bénéficie également, de l’apport des nouvelles voix néerlandaise, anglaise, hispano-américaine et québecoise, ainsi que de la mise à jour de toutes les langues.

De plus, avec le module MRCP 1.1, Acapela Telecom 6.1 s’intègre aisément dans des architectures complexes permettant des déploiements massifs en utilisant au mieux le potentiel de la synthèse vocale.

Virtual Speaker 2.0 disponible sous Windows – y compris Vista, s’adresse aux utilisateurs souhaitant créer leur propre contenu audio, à partir de texte permettant ainsi vocaliser tout type d’application par l’intégration de fichier sons.

Du message de quelques mots jusqu’à la vocalisation de manuels, de comptes rendus ou de tout autres types de textes, Virtual Speaker est toujours et immédiatement disponible pour n’importe quelles créations sonores, 24 heures sur 24, 7 jours sur 7.

Avec son casting de près de 30 speakerines et speakers, dont 8 nouvelles voix (Français, Allemand, Portugais, Danois, Québécois, Espagnol Nord-américain, Néerlandais et Anglais britannique), dans 15 langues, Virtual Speaker est très apprécié dans un contexte international pour la création de prompts dans les applications téléphoniques, pour l’e-learning et pour la création de contenu audio. Virtual Speaker 2.0 intègre de multiples améliorations ergonomiques et peut se louer à l’heure ou à l’année pour s’adapter aux besoins des entreprises.

''A propos d’Acapela Group Acapela Group, 1er groupe européen dédié aux solutions vocales multilingues, est entièrement dédié au développement et au déploiement d’interfaces de langage naturelles. Les solutions vocales d’Acapela Group sont déjà déployées dans de nombreux services et applications: portails vocaux, messagerie unifiée, centres de contact, web parlant, jeux interactifs, logiciels ludo-éducatifs, programmes de e-learning, outils pour l’accessibilité, systèmes de navigation embarquée etc.

De nombreux clients et partenaires lui ont déjà fait confiance au fil de leurs projets vocaux: Alcatel, Apoll, AssistiveWare, Atos Origin, Avaya, S.E.B., Bosch Blaupunkt, Cegetel, Daimler Chrysler, Dolphin, Don Johnston, Handitek, Harman Becker, Imagetalk, Intervoice, Kirusa, Klett, Magneti Marelli, Navteq, Once, Phoneticom, PSA Peugeot Citroën, Telia, Telefonica, Temic, Tieman, Toby Churchill, Scandis, Sensory Software, SFR, Siemens, Vocalcom, Voxtron, etc.''

Recherches full audio vidéo

En s’associant avec PodZinger, Factiva allie des technologies avancées à un contenu de premier plan pour des recherches audio et vidéo révolutionnaires

NEW YORK, le 4 juin 2007 : Dow Jones & Company (NYSE: DJ) vient d’annoncer la conclusion d’un partenariat avec PodZinger, la première plate-forme multimédia qui permet à ses utilisateurs d’accéder à un contenu audio et vidéo en effectuant une recherche par mot clé. Ce partenariat vise à intégrer un contenu multimédia dans Factiva.com et Factiva iWorks, solutions d’actualité et d’informations économiques de premier plan destinées aux entreprises du monde entier. Dès le mois d’août prochain, les utilisateurs de Factiva pourront accéder en toute facilité à un contenu audio et vidéo comprenant notamment des informations économiques, des interviews et déclarations de dirigeants d’entreprises, des assemblées générales d’actionnaires, des informations sur les produits et encore bien d’autres renseignements essentiels pour leur activité.

Selon eMarketer, pour le seul mois de janvier 2007, plus de 7,2 milliards de flux vidéo ont été visionnés par 123 millions de consommateurs. Et selon AccuStream iMedia, le nombre d’utilisateurs de contenu multimédia devrait augmenter de 30 % par an.

"Les entreprises sont bien conscientes que le contenu multimédia se propage de manière exponentielle", déclare Clare Hart, vice-présidente de Dow Jones et présidente de Dow Jones Enterprise Media Group. "Pourtant, trouver un contenu pertinent peut prendre un temps considérable ; en effet, la plupart des sites multimédia se contentent de proposer quelques métadonnées et n’offrent que les fonctionnalités de recherche basiques pour les contenus audio et vidéo, générant ainsi un trop grand nombre de résultats qui se révèlent bien souvent inadaptés. "

"Les contenus vidéo et audio jouent un rôle de plus en plus important dans la recherche d’informations et le suivi de l’actualité, en particulier pour les entreprises qui veulent disposer d’une vision globale de leur activité. A travers ce partenariat avec PodZinger, nous réaffirmons notre volonté d’offrir aux entreprises la possibilité d’exploiter tous les avantages des contenus émergents et des technologies du Web 2.0 ", ajoute-t-elle.

Grâce aux technologies de synthèse vocale et de traitement du langage naturel développées par PodZinger, l’offre multimédia de Factiva garantit à ses utilisateurs des résultats de recherche extrêmement pertinents. En outre, cette fonctionnalité intègre Factiva Intelligent Indexing, système d’indexation exclusif, ainsi que l’affichage des résultats sous forme de graphiques, qui permet aux utilisateurs de comprendre et d’exploiter rapidement leurs résultats de recherche. D’après un sondage réalisé en 2006 par PodZinger, les utilisateurs ne consultent pas l’intégralité, mais 15 % seulement d’un fichier audio ou vidéo. En conjuguant les fonctionnalités de Factiva et de PodZinger, Dow Jones propose un outil de recherche multimédia inégalé permettant à ses utilisateurs d’accéder à des extraits de contenu courts et ciblés, correspondant à des termes de recherche spécifiques, à partir desquels il est possible de consulter les sections les plus pertinentes ou l’intégralité de la séquence.

Selon Tom Wilde, directeur général de PodZinger : "Compte tenu du poids grandissant du contenu multimédia dans l’actualité disponible en ligne, il est essentiel de fournir aux utilisateurs un moyen de repérer les éléments qu’ils recherchent dans tous ces fichiers audio et vidéo. Les fonctions de recherche uniques offertes par PodZinger offrent un gain de temps considérable aux utilisateurs de Factiva : ils peuvent facilement écarter les résultats inutiles et accéder rapidement aux informations les plus pertinentes. "

L’offre multimédia de Factiva comprend : - Un contenu mis à jour en permanence, provenant de plus de 4000 sources (et recueils) d’actualité et d’informations économiques, et plus de 300 000 séquences individuelles. - Des archives d’actualité et d’informations économiques remontant à 90 jours, et comprenant des sources telles que The Wall Street Journal, NPR, CNN, BBC Radio et encore bien d’autres. - Plusieurs langues d’interface : le français, l’anglais, l’espagnol, l’allemand et le russe. Vous trouverez de plus amples renseignements sur les produits offerts par Factiva sur le site factiva.com. Pour plus informations sur Dow Jones, rendez-vous sur dj.com.

VXML 2.1 : nouvelles fonctionnalités !

Le W3C a publié hier une nouvelle définition du VoiceXML, avec la version 2.1 et du SISR (Semantic Interpretation for Speech Recognition). Cette version enrichit l'usage des dialogues popularisés par le VXML 2.0 et ajoute les fonctions de grammaire et scripts dynamiques, tout en conservant la compatibilité avec les versions écrites en 2.0 ! Le SISR, quant à lui, permet de transcrire les commandes comprises par le traitement du langage en requêtes structurées.

Prochaine étape : le VXML 3.0

Pour les technophiles : les pages sur le VXML 2.1

''Le groupe de travail "Voice Browser" du W3C est piloté par des acteurs comme Aspect Communications, Comverse, Deutsche Telekom, France Telecom, Genesys, HP, IBM, Loquendo, Matsushita, Nuance Communications, Voxeo ou Voxpilot. ''

page 2 de 2 -