Ce n’est pas parce que …

… l’on peut regretter (et l’écrire) que l’iPhone soit sourd (comprenez sans reconnaissance vocale d’origine) … qu’il faut le bouder !

Donc, depuis hier, je suis l’heureux propriétaire de cet appareil dont la première fonction est de nous montrer que l’on peut concilier fonctions ET utilité, sans une documentation imposante ! Merci à Steve Jobs pour son exigence, parfois tyrannique, sur l’aspect user friendly de ses applications.

Et donc, vous vous en doutez, vous aurez bientôt une revue des différentes solutions vocales, testées en vrai !

P.S. : merci à mon ancien mobile qui m’a aidé à agir en rendant l’âme …

Syspine, la VoIP en low cost

Une offre de VoIP pour les PME, accessible et avec standard automatisé ? C’est ce que propose Syspine, avec son offre Syspine Digital Operator Phone System, à base de l’offre Microsoft Response Point (notre billet de janvier). Le système semble simple à installer et à paramétrer, même pour les « béotiens » (leur communication parle des hommes des cavernes) de l’informatique.

Et comme les petites organisations n’ont pas toujours assez d’assistants, la reconnaissance vocale permet d’automatiser le standard pour accueillir les appels au mieux. L’on peut même envisager un mini SVI capable de répondre aux questions simples …

Plus d’infos :

Psychodrame autour de Nintendo

Si vous ne l’avez pas encore utilisé, vous avez au moins entendu parler du fameux test des facultés mentales du docteur Kawashima, qui permet à Nintendo de vendre des DS aux adultes !

L’ennui, c’est que la reconnaissance vocale est utilisée … et que les écossais se sentent discriminés … Oui, sérieusement, depuis quelques jours les journaux outre manche se déchaînent autour du sujet. Selon Nicky Campbell de WatchDog, programme de la BBC, la façon de prononcer certaines réponses n’est pas comprise et c’est donc de la discrimination.

Ceci prouve au moins deux faits : que les travaux des linguistes sur les corpus vocaux servent … et que l’accent écossais existe !

Mais aussi que la reconnaissance vocale touche de si près le coeur de notre cerveau qu’il exacerbe les réactions. Qui n’a jamais été surpris de voir une personne essayer de tromper un système de reconnaissance (pour se prouver sa supériorité face à la machine) alors qu’il utilise une base de données sans se soucier de ses limites … et en oubliant que les humains ont aussi des défaillances (vous le comprenez, vous, l’accent écossais ?)

Le clip qui a tout déclenché :

Microsoft et la publicité

La publicité attise les idées. Microsoft vient de montrer quelques avancées de son labo dédié, le adCenter labs, lors du Demo Fest.

Il s’agit, évidemment, d’analyses contextuelles et sémantiques, pour aider au ciblage. Ainsi pour la vidéo, l’analyse du discours permet de repérer les mots clés et d’afficher les publicités ayant trait au sujet.

Au passage, vous verrez que le site de ce laboratoire n’a pas le design habituel des centres de recherche … il faut séduire les publicitaires !

SpeechSwitch change son Board

Mark Meller remplace Jerry Mahoney, stuff démissionnaire, ask au conseil de SpeechSwitch.

Président de MM2 group et de Trey Resources, ailment depuis 2004, Mark Meller a aussi dirigé iVoice Technology, Deep Field Technologies et Bristol Townsend & Co.

Il devrait donc apporter une forte expertise de développement de sociétés de haute technologie à SpeechSwitch, spécialiste des services vocaux pour la téléphonie, notamment les standards automatisés, par ailleurs spin off de iVoice.


En savoir plus :

Biométrie chez ImageWare

La gestion de l’identité est un vrai soucis pour certaines organisations. ImageWare annonce son IWS Mediator, une suite multi-lingue d’applications biométriques pour les besoins de défense, contrôle des frontières et sécurité publique.

Cette plate-forme permet la traduction temps réel mais aussi l’analyse biométrique de la voix, du visage, de l’iris et des empreintes.

C’est par le rachat de Sol Logic en décembre dernier, que Jim Miller, le président d’ImageWare a pu étendre ses applications aux technologies de traduction de la parole.

On reparlera bientôt de biométrie vocale.

Pour en savoir plus sur ImageWare :

Connaissez-vous SRI ?

SRI International est une organisation indépendante et à but non lucratif de recherche, basée dans la Silicon Valley, fondée en 1946 sous le nom complet de Stanford Research Institute. Les recherches et développement de cet institut ont apporté nombre d’innovations et de spin-off (dont Nuance …).

Et puisque l’on parle de technologies vocales, SRI vient de déposer un brevet pour V2DB (prononcer à l’anglaise), la technologie d’accès vocal aux bases de données. Ainsi les utilisateurs pourront consulter et modifier des enregistrements en interaction vocale, sujet à la mode avec le développement des offres de recherche. V2DB fonctionne avec les principaux logiciels de reconnaissance de la parole.

Horacio Franco, directeur scientifique du laboratoir des technologies vocales de SRI et co-inventeur dit que « les utilisateurs attendent des solutions plus rapides et efficaces dans leur recherche d’information … V2DB permettra l’optimisation des offres ».

Plus sur SRI Speech Technology