Trop peu, trop tôt… Le Wehead a encore un long chemin à parcourir avant d’être pris au sérieux, tant sur le plan matériel que logiciel.
Alors que nous parcourions les étages de l’événement Showstoppers au CES, mes yeux se sont posés sur quelque chose de familier. J’ai établi un contact visuel (au mieux de mes capacités à établir un contact visuel avec un ensemble d’yeux virtuels) avec l’appareil Wehead, d’une valeur de 5 000 dollars, dont j’avais parlé il y a quelques semaines à peine. Il était posé sur une table isolée dans un coin de l’immense salle de bal où se tenait l’événement, et quelques personnes avaient pris leur courage à deux mains pour lui parler. Je voulais évidemment me faire une idée de ce que c’était que de discuter avec une IA, mais aussi voir si cet appareil de 5 000 dollars valait la peine d’être présenté. Pour faire court, le Wehead était un peu raté de bout en bout. Le matériel n’avait pas la finesse que l’on est en droit d’attendre d’un produit haut de gamme, et le logiciel ne parvenait pas à traiter les requêtes au milieu du bourdonnement de toutes les personnes qui l’entouraient.
Concepteur : Wehead
Le Wehead a d’abord été conçu comme un appareil de téléconférence unique en son genre qui vous permettrait de parler à des personnes via des applications de vidéoconférence, mais au lieu de regarder un écran, vous auriez à regarder une tête qui bougerait et réagirait aux actions de la personne à l’autre bout de l’appel. À un moment donné, l’entreprise a décidé d’en faire un assistant de type ChatGPT qui utiliserait l’IA pour répondre aux questions et augmenter la qualité de vie. La différence entre Wehead et un assistant tel que ChatGPT, Siri ou Google Assistant ? Le fait que Wehead ait un visage, ce qui, du moins en théorie, ajouterait un aspect plus immersif et crédible à l’ensemble de l’expérience.
Le problème, cependant, réside dans deux grands domaines : premièrement, Wehead est une solution à la recherche d’un problème. L’absence de composante faciale dans l’IA peut être un problème, mais ce n’est pas un problème qui exige un robot bionique multi-écrans de 5 000 dollars. Deuxièmement, même si cela était vrai, le Wehead lui-même était un appareil plutôt mal assemblé, utilisant quatre téléphones portables, un micro canon et un haut-parleur pour donner au ChatGPT une touche anthropomorphisée.
Pour commencer, un simple coup d’œil sur le Wehead révèle que ses quatre écrans sont en fait des smartphones assemblés en une grande solution Macgyvered. L’élément d’écran avec les yeux de Wehead avait en fait une découpe visible pour la caméra frontale. Au-dessus de celle-ci se trouvait un microphone de type « shotgun » qui capturait les voix, et en dessous, un petit haut-parleur à l’endroit où l’on s’attendrait à trouver la gorge de Wehead. Les quatre écrans affichaient des parties du visage de la tête de mort, qui émettaient et réagissaient lorsque la tête de mort parlait, écoutait et interagissait.
Cependant, même si le matériel semblait avoir été mis au point par une bande d’étudiants en ingénierie, le Wehead n’a pas tenu ses promesses. Son visage était perpétuellement pixelisé, ce qui a eu un impact sur le réalisme déjà en baisse de la tête de mort. Il y avait un décalage important entre l’audio et les mouvements du visage, ce qui ajoutait des problèmes supplémentaires au mélange… et enfin, la tête de poisson ne semblait pas pouvoir saisir quoi que ce soit de ce que quelqu’un disait. Certes, l’événement était bondé, ce qui entraînait beaucoup de bruits de fond, mais la tête-de-bœuf ne parvenait toujours pas à répondre aux questions de base qu’elle saisissait. Lorsque le Wehead s’est retrouvé bloqué dans l’une de ses boucles de rétroaction « Je suis désolé, je ne comprends pas », un représentant de l’entreprise est venu pour l’inciter à cesser de répondre, mais il lui a fallu trois tentatives pour que le Wehead s’arrête. On peut attribuer une grande partie de cette situation au bruit de fond de l’événement général, mais cela a pratiquement mis la tête d’IA sur la voie de l’échec, en montrant son incapacité manifeste à isoler l’audio avant de le traiter.
Mais voilà, je pense que le Wehead a un grand potentiel. Il a juste besoin de BEAUCOUP de travail avant de pouvoir justifier son prix. Pour commencer, il faudrait peut-être remplacer les écrans de smartphone par quelque chose de plus unique, comme un OLED incurvé… et cacher le microphone et le haut-parleur, pour qu’il ne soit pas évident qu’il a été assemblé avec du matériel acheté chez Best Buy. Une tête parlante exécutant ChatGPT semble impressionnante, mais l’illusion s’effondre lorsqu’elle ressemble à un projet universitaire et que la tête parlante elle-même peut à peine capter ce que vous lui dites.
Spécialiste jardin et bricolage, j’adore rédiger des articles qui aide les lecteurs à améliorer leur maison ! Souvent connecté, n’hésitez pas à poser vos questions !