Mon ami Bret Kinsella, de voicebot.ai m’a rĂ©cemment demandĂ© quelles sont mes prĂ©dictions pour l’IA et la Vocalisation. Vous pourrez trouver ma contribution dans le post 2017 Predictions From Voice-first Industry Leaders (« 2017, PrĂ©dictions de leaders du secteur des technologies vocales »). Dans cet article, je mentionne la notion de mĂ©tadonnĂ©es du discours (speech metadata), sur laquelle j’aimerais ici revenir.  

En tant que dĂ©veloppeur d’Applications VocalisĂ©es, lorsque vous devez gĂ©rer des commandes vocales sur une enceinte Amazon Echo ou Google Home, le mieux que vous puissiez avoir aujourd’hui c’est la transcription du texte prononcĂ© par l’utilisateur.

Certes, avoir enfin accĂšs Ă  des fonctionnalitĂ©s efficaces de conversion de texte par synthĂšse vocale est pas mal ; mais il est assez dommage que, ce faisant, tant d’informations prĂ©cieuses soient perdues !

Il faut savoir qu’une commande vocale c’est plus qu’une simple sĂ©quence de mots, c’est Ă©galement :

‱ des personnes – est-ce John ou Emma qui parle ?

‱ des Ă©motions – Emma est-elle heureuse ? en colĂšre ? excitĂ©e ? fatiguĂ©e ? en train de rire ?

‱ un environnement – se promĂšne-t-elle sur la plage, ou est-elle bloquĂ©e dans les bouchons ?

‱ des sons environnants – une porte qui claque ? une alarme incendie ? le chant des oiseaux ?

Imaginez un peu les possibilitĂ©s, la classe de ces conversations si on pouvait avoir accĂšs Ă  toutes ces informations… Énorme !

Mais nous pourrions aller encore plus loin. Dans la communication, tout le monde sait que lorsqu’on Ă©change avec quelqu’un, le non verbal est tout aussi important que le verbal.

Alors pourquoi donc nous limiter Ă  l’aspect verbal de la communication dans nos interactions avec des Applis VocalisĂ©es ?

Les mĂ©tadonnĂ©es du discours concernent justement les informations non verbales, qui reprĂ©sentent selon moi la face cachĂ©e de l’iceberg, et donc la plus intĂ©ressante Ă  explorer !

Un bon exemple de métadonnées du discours est la combinaison image/voix dans le film Her.

L’ajout de la camĂ©ra fait que de nouvelles conversations peuvent avoir lieu, comme par exemple parler d’un coucher de soleil, de l’origine d’une Ɠuvre d’art, ou encore de la composition d’une barre chocolatĂ©e !

Asteria est l’une des nombreuses startups qui commence à offrir de type d’interactions riches.

Je pense que c’est une voie Ă  suivre, et qu’avec la prĂ©sence des mĂ©tadonnĂ©es conversationnelles, un nombre consĂ©quent d’applis innovantes verront le jour.

Et j’espĂšre surtout qu’Amazon, Google & Microsoft vont diffuser une partie de ces donnĂ©es en 2017, afin que nous, les dĂ©veloppeurs, puissions plancher sur un agent conversationnel pleinement conscient de son environnement.

Smartly.ai est un logiciel d’automatisation de la Relation Client.
Nos chatbots soulagent vos équipes support, réduisent le temps de réponse et améliorent la satisfaction client.

© 2021 Smartly.AI