La voix, nouvelle interface

Bouche

Elle révèle, raconte, sonne et résonne.

Elle est rauque, fluette, chaleureuse, étouffée ou encore mélodieuse.
Elle est souvent un transmetteur essentiel d’émotions et le reflet de la personnalité de celui qui s’exprime. 

La voix porte la parole de l’Homme et parfois même le caractérise.

Désormais, les machines ont des voix et entendent la nôtre. Ceci n’est plus une prophétie mais bien une réalité : les prochaines innovations sont vocales, ce qui nous offre un immense terrain à explorer.

Parce que l’interaction avec la machine est rendue possible par la voix, celle-ci devient une nouvelle interface. Hier l’invention de l’icône par David Canfield Smith et de la souris ont rendu accessible l’informatique en permettant d’exécuter des lignes de commande de manière simple et ludique. La voix supprime l’intermédiaire qu’est l’écran, et c’est en cela que le changement est fondamental. L’étape ultime viendra quand nous commanderons les machines par la pensée, mais les impacts en termes d’interactions seront similaires à ceux introduits par la voix.
L’objet est ici de nous questionner sur ce qui évolue, change, se crée dans les produits, les services, la relation client et les organisations.

Nous vous proposons d’approfondir trois points qui nous semblent clé, ce que cela nous fait de parler à des objets et de les entendre nous parler. A quoi ressemble le design d’interfaces et de services quand il est vocal. Et, quels sont usages et limites de la voix dans ces cadres.

DESIGN D’INTERFACES ET DE SERVICES

Ainsi, la voix va devenir un moyen d’interactions homme-machine de plus en plus fréquent et dépasser la simple utilisation que l’on en fait aujourd’hui : parler à Siri et attendre de lui une réponse – entre autres – textuelle et visible à l’écran.

Nous le reconnaissons, l’expression utilisée dans la Silicon Valley « Voice is the new UI » est significative. Nous voulons donc imaginer les impacts que cela aura sur le design de produits et services digitaux uniquement vocaux – supprimant l’interface visuelle – et souhaitons réfléchir aux effets que cela a sur l’organisation : quels vont être les conséquences de la présence de la voix dans l’expérience utilisateurs et quels vont être les challenges à relever pour faire que celle-ci soit optimale ?

Humaniser pour mieux convaincre.

Pour rendre aussi naturelle que possible, aussi humaine que possible, l’interaction vocale entre l’utilisateur et la machine, il nous semble fondamental d’humaniser l’intelligence artificielle. Cela s’exprime par la prise en compte des différences culturelles et du caractère de l’utilisateur qui s’adresse à l’intelligence artificielle. Le défi est de taille. Réussir à donner une personnalité à la machine elle-même. Puisqu’Alexa, donne de la voix, on attend d’elle qu’elle exprime SA voix, qu’elle ait un tempérament, elle doit être sympathique, joyeuse, pratiquer l’humour et même, hésiter et faire des erreurs, comme les humains. Bien entendu, il en va de même pour un micro-ondes ou le concierge virtuel d’un hôtel, ils doivent pour être crédibles, nous ressembler et faire preuve d’une artificielle empathie.

Jeu d’imitation : Le Test de Turing

En 1950 Alan Turing met au point un test qu’il nomme « jeu d’imitation » d’intelligence artificielle qui consiste à mettre un humain en confrontation verbale à l’aveugle avec un ordinateur et un autre humain et à reconnaître lequel est une machine. 

En 1990, le Prix Loebner récompense les intelligences artificielles répondant le mieux au test de Turing. Il est intéressant de noter que souvent les intelligences artificielles qui ont eu les meilleurs scores sont celles qui imitaient le mieux les comportements humains : hésitations, erreurs, vitesse de calcul limitée etc.

Vers un charte sonore et de l’IA vocal design.

C’est pour ces raisons qu’il est nécessaire de designer avec efficacité et élégance les arbres de décisions, le traitement des objections, des non-compréhension, des « bavardages ». C’est aussi l’occasion pour les marques et leurs communiquants de faire s’exprimer entièrement un univers dans l’IA vocale, de faire qu’elle incarne la marque, qu’elle devienne une effigie, une mascotte vocale. Ainsi, puisqu’aujourd’hui nous avons des chartes graphiques, des éléments de langages pour les réseaux sociaux, nous devrons désormais concevoir un IA vocal design. Cependant ici se pose une question fondamentale : la voix des intelligences artificielles des GAFAs laisseront-elles la main à 

celles des marques ? l’IA de Google me redirige vers la FNAC, l’IA de la FNAC prend-elle le relai, avec sa propre personnalité, différente de celle de Google ? Ou es-ce l’IA de Google qui parle en permanence ? Dans un cas nous discuterons avec tout un monde de personnages imaginaires représentant chacun l’univers d’une marque, dans l’autre Google deviendra encore plus indispensable et tout-puissant.

Des avis client vocaux encore plus impactants

On le pense, grâce à la voix, les avis client et la présentation des produits et services d’une entreprise deviennent encore plus impactants. On peut en effet imaginer qu’un utilisateur demande à son assistant vocal ce que pensent les clients du dernier iPhone, et obtient une sélection des avis des clients enregistrés vocalement qui lui ressemblent le plus : quelqu’un qui vient de sa région, qui a une voix ou un accent familier, plutôt une femme, ou un homme, etc. En permettant l’enregistrement vocal des avis, en rendant leur écoute possible, on les rend encore plus humain et on lui donne encore plus de résonance qu’aujourd’hui.

Et cela peut être le cas de la présentation des produits et services d’une marque ! On pourrait concevoir qu’au moment de réserver une nuit d’hôtel, le chef du restaurant de celui-ci prenne la parole dans l’assistant vocal pour présenter le menu du soir, la manière dont il est construit, les produits sélectionnés… les assistants vocaux pourraient ainsi laisser la parole aussi aux créateurs, devenant ainsi à leur tour des ambassadeurs éclairés et investis.

Les notifications elles aussi, grâce à la voix peuvent être repensées

Comment se comporteront-elles quand nos enceintes connectées, nos objets connectés s’adresseront à l’utilisateur pour lui dire qu’il faut éteindre le four parce que le gâteau au chocolat est en train de brûler, que Johny est mort ou que votre date a répondu à votre message sur Tinder ? Ces notifications se feront-elles vocalement ? A quel point seront-elles intrusives ? Quelles guidelines les fournisseurs d’enceintes fourniront-ils aux marques ?

Enfin une interface accessible!

Enfin, grâce à la voix comme interface, les outils digitaux vont être presque absolument accessibles, au-delà de fournir un outil incroyable pour les malvoyants ou les personnes à mobilité réduite. D’abord parce que celle-ci renverse le rapport d’apprentissage. En effet, aujourd’hui c’est l’utilisateur qui doit apprendre à utiliser les interfaces et s’adapter au rythme de leurs évolutions. Mais cela change avec la voix et l’IA car c’est elle qui doit apprendre à comprendre la requête de l’individu pour lui fournir la meilleure réponse.

L’IA via la voix va donc dans un premier temps rendre accessible la technologie à des personnes néophytes, notamment les personnes âgées. Et, à plus long terme l’ensemble des services numériques seront accessibles par la voix, sans passer par une interface visuelle, un device avec de nouveaux boutons, un parcours utilisateur différent d’un service à l’autre, ce qui rendral’IA de Google me redirige vers la FNAC, l’IA de la FNAC prend-elle le relai, avec sa propre personnalité, différente de celle de Google ? Ou es-ce l’IA de Google 

Google

leur compréhension et manipulation encore plus simple et accessible. Enfin, grâce à la force de l’IA, c’est le service qui s’adaptera à l’utilisateur et non l’inverse, offrant au second l’économie de l’effort d’apprendre.

Quelles conséquences sur nos métiers?

Cela a une conséquence sur nos métiers, les profils recherchés pour designer les services autour de la voix pourraient changer. En imaginant toutes ces évolutions possibles il est probable que les UX designers de demain seront accompagnés par des sociologues, psychologues et des linguistes. Il reste à définir quelles seront demain les équipes qui sauront le mieux designer les services autour de la voix et de l’intelligence artificielle afin qu’elle réponde à cette très forte promesse.

USAGES DE LA VOIX

Ces éléments d’UX nous font évidemment nous questionner sur les usages et limites de l’utilisation de la voix dans le digital.
Comme nous, vous trouverez beaucoup de littérature à ce sujet, on vous laisse creuser.  Mais avant de lire, de lire et de lire, nous avons listé pour vous les trois typologies d’usages qui nous paraissent clé.

Avant tout, ayons en tête un postulat essentiel : l’utilisation de sa propre voix pour commander une machine, c’est merveilleux, mais pour que la promesse soit délivrée, il faut que cela fonctionne parfaitement. Personne n’a envie de répéter trois fois « Alexa joue la playlist anniversaire » alors que vous lancez votre soirée.

la recherche vocale oui, mais avec de gros impacts

Le premier usage que nous relevons est la recherche vocale : c’est l’usage le plus évident et le plus évident. Cependant, malgré son évidence, il révolutionne de nombreuses pratiques pour les marques. Comment travailler son SEO avec des requêtes plus longues, sans fautes d’orthographe (puisque la machine retranscrit ce qu’elle entend) mais peut-être avec d’autres genres de fautes ? Comment exister dans les requêtes opérées sur les moteurs de recherches alors qu’une enceinte connectée ne fournira qu’une seule réponse, à l’opposé d’un moteur qui en fournira des milliers ? Que faire de son tunnel d’achat si plus personne ne vient sur mon site e-commerce ? Comment répondre de manière personnalisée en fonction de l’utilisateur qui formule sa requête ? Comment s’adresser différemment à un enfant ou à un adulte ?

Google Home

L’accessibilité développe naturellement les services à la personne.

Le deuxième usage qui nous semble important est celui des services à la personne et ce, notamment à travers la domotique. Dans ce cas d’usage on se rend compte à quel point la voix est une interface d’une exceptionnelle simplicité d’utilisation. « Alexa, allume la lumière ». Pas besoin de déverrouiller un smartphone, de voir des boutons, d’appuyer sur le bon, de faire des mises à jour etc. C’est simple comme de parler, et en cela c’est un changement fondamental. 

Reste à faire en sorte que l’expérience une fois la conversation engagée soit aussi fluide que la formulation de la requête. C’est ici que tout le travail est à faire. Par ailleurs si l’on réfléchit à un usage non sollicité par l’utilisateur via une requête, mais par l’enceinte elle-même, on pourrait penser en matière de sécurité à détecter par le son : une chute, une crise d’épilepsie, un feu qui démarre, bref les usages sont infinis, ne reste plus qu’à les imaginer… Un assistant lorsqu’on a les mains prises Un autre usage nous semble essentiel, c’est celui – tout simplement – d’aider l’utilisateur qui a les mains prises ! A titre d’exemple, de nombreux usages ont été imaginés pour la voiture connectée afin d’assister le conducteur. Et ce, en lui évitant de détourner le regard de la route ou les mains du volant. Mais des centaines d’autres usages sont à imaginer.  Imaginons le chirurgien qui demande à un robot de lui tendre un outil ! Un pâtissier, les mains dans la pâte feuilletée, demandant combien il faut de grammes de farine pour son pâton, un serveur demandant d’ouvrir la porte, les mains occupées par un plateau. Finalement, la seule limite est… l’imagination ! On pourrait passer des heures, des ateliers entiers à imaginer des usages autour de la voix, dans tous les secteurs : banque en ligne & voix, tourisme & voix, culture & voix, livraison & voix, sites de rencontre & voix ; industrie & voix, etc. Pour cela oublions ce que nous connaissons sur le design d’interfaces et de services, et pensons dans un nouveau cadre à créer ensemble, celui de la voix et de l’intelligence artificielle.

LIMITES ET POINTS DE VIGILANCE

Sans susciter des polémiques ou de grands débats philosophiques, chez Pack. on identifie quelques points d’attention sur la technologie et ses usages.

Intimité et intrusivité.

Celui de l’intimité et de l’intrusivité de la technologie dans nos vies personnelles. Imaginez que votre boîte mail ou que votre Whatsapp cause… Des dizaines, des centaines de notifications qui parlent. Allons-nous aimer ou être jaloux de notre IA vocal ? Allons-nous parler plus à nos enfants qu’à nos assistants vocaux ?

Et en parlant intime, chez Pack. on se dit qu’il y a plus chances pour que les assistants vocaux se fassent entendre plutôt à la maison que dans des lieux publics ou au travail. En effet lorsque l’on écrit un SMS, autour de nous – sauf si on est collé à son voisin de métro – personne ne le lit à part son récepteur. Lorsque l’utilisateur parle, il émet des sons, et n’a certainement pas envie que ses voisins entendent des éléments de sa vie prive ou professionnelle. D’ailleurs, peut-être vous souvenez-vous que les tablettes tactiles placées en vitrine ou en magasin ne sont pas utilisées. Savez-vous pourquoi ? Parce que personne ne veut être vu en train de les utiliser mais surtout, personne ne veut partager ses requêtes.

Respect de la vie privée et utilisation des données.

Bien sûr, un des points de vigilance fondamental est la question du respect de la vie privée et de l’utilisation des données. Encore plus dans un cas d’usage comme ceux évoqués plus haut où l’enceinte « écoute » passivement pour déclencher par exemple une alerte en cas de chute. Quel stockage et quelle utilisation des données ?

Enfin il nous faudra réfléchir quelle sécurité déployer avec des appareils facilement piratables en ne perdant pas de vue que de nouvelles formes de violences domestiques sont apparues récemment avec l’utilisation des objets connectés et enceintes intelligentes, des enceintes se mettant à parler toutes seules, pilotées à distance par des personnes mal intentionnées…

Et les enfants face à la voix et l’IA?

Un dernier point nous parait très important. C’est celui de l’éducation des enfants. Comment faire comprendre à son enfant qu’un assistant vocal n’est pas un humain alors qu’il a une voix parfaitement humaine ? Et demain si nos fours à micro-ondes se dotent de hauts parleurs, vont-ils se mettre à parler? A un âge auquel on croit aux personnages imaginaires, comment faire la différence entre un humain et un objet ? Pour aller plus loin sur ce point, que penser du fait que Alexa félicite les enfants lorsqu’ils utilisent des formules de politesse ? Ou Google Home qui ne répond pas si l’enfant n’a pas dit de formule de politesse ?

Pour finir…

Nous assistons aux prémices d’un vrai changement dans nos vies, du même ordre que lorsque les smartphones y sont entrés. Et cela va impacter les entreprises, elles doivent se questionner et anticiper l’adaptations de leurs produits et services, de leurs relations clients et de leurs organisations. Par ailleurs, elles doivent et plus généralement, cela soulève des questions éthiques autour de la place que nous souhaitons donner à ces nouveaux compagnons dans nos vies et foyers. Nous sommes persuadés que ceux qui feront la différence seront ceux qui sauront allier usage, design d’interface de qualité et discrétion. 

Facebook
Twitter
LinkedIn