Dans ce monde d’IA et de modèles de génération de texte à partir d’images, je me pose sans cesse une question : qu’est-ce qu’une photo ? S’agit-il de quelque chose que l’on capture à l’aide d’un objectif et d’une pellicule ? Ou un capteur d’images ? S’agit-il d’une poignée de pixels arrangés par un appareil photo, un être humain ou une IA ? Si c’est le cas, la photographie va bien au-delà de ce que fait un appareil photo. Voici le Paragraphica, un appareil photo créé par Bjørn Karmann qui n’a ni objectif, ni capteur, en fait, aucune technologie d’imagerie. Pourtant, le Paragraphica prend des photos de scènes… Comment ? En bref, il utilise l’IA et les données de localisation pour imaginer ce que vous regardez. La réponse plus longue est beaucoup plus fascinante !
Concepteur : Bjørn Karmann
L’expression « capture de photos » avec le Paragraphica est peut-être un peu exagérée, car il ne capture pas vraiment quelque chose. Il génère plutôt des photos en utilisant des données de localisation, provenant de Google Maps, pour être précis. Le Paragraphica peut accéder à votre position et trouver une image correspondante de ce que vous regardez dans Google Street View. Il utilise ensuite l’heure, la météo et quelques autres paramètres pour exécuter un modèle d’IA Image to Image et générer une nouvelle photo fantaisiste à partir de rien.
L’appareil photo fonctionne en recueillant des informations sur son environnement par le biais d’API ouvertes. Il prend en compte l’emplacement, la météo, l’heure de la journée et les points de repère à proximité. En combinant tous ces points de données, Paragraphica crée un paragraphe qui dépeint avec précision le lieu et le moment présent. Grâce à une IA texte-image, l’appareil photo transforme ensuite le paragraphe en « photo ». Mais il ne s’agit pas d’un simple cliché. L’image résultante est une représentation complexe et nuancée du lieu et de la manière dont le modèle d’IA le perçoit. Vous trouverez ci-dessous un aperçu de la manière dont Paragraphica compose des messages et les utilise pour générer des images. Il y a beaucoup de place pour des entrées variées, qui peuvent être ajustées par trois boutons sur le dessus de l’appareil photo.
« Il est intéressant de noter que les photos capturent certaines ambiances et émotions de l’endroit, mais d’une manière étrange, car les photos ne ressemblent jamais exactement à l’endroit où je me trouve », explique Karmann.
Les trois boutons vous permettent de contrôler votre résultat global, un peu comme vous régleriez l’ouverture, l’exposition et la longueur focale sur votre appareil photo analogique ou numérique. La première molette de la caméra AI fonctionne comme la longueur focale de l’objectif d’un appareil photo, mais au lieu de régler la mise au point, elle contrôle le rayon (mesuré en mètres) de la zone que la caméra balaie à la recherche d’informations et de lieux. La deuxième molette, quant à elle, permet de décider du type d’image que vous créez. Comme dans Midjourney, le fait de jouer avec la valeur de semence permet de créer de nouvelles bases pour différents styles d’image. La troisième molette, qui contrôle l’échelle de guidage, s’apparente à la mise au point d’un appareil photo traditionnel. En augmentant l’échelle de guidage, l’IA adhère plus étroitement au paragraphe, ce qui donne une image plus « nette », tandis qu’en la diminuant, on obtient une image plus « floue ».
Le nom Paragraphica est assez intéressant car il souligne le passage du paragraphe au graphique, tout en sonnant comme photographique. Le produit présente également un design à la fois excentrique et magnifique. Il ressemble exactement à un appareil photo, ce qui fait que l’on sait immédiatement comment le tenir ou l’utiliser. Cependant, la différence avec le Paragraphica est l’absence palpable d’un objectif d’appareil photo. Au lieu de cela, le designer Karmann a décidé de créer une coupelle rouge unique en forme d’étoile sur le devant de l’appareil. Ce détail s’inspire de la taupe à nez étoilé, qui vit et chasse sous terre, s’appuyant sur un nez en forme de tentacule pour sentir et chercher plutôt que sur des yeux pour voir. « Cet animal extraordinaire est devenu la métaphore et l’inspiration parfaites pour montrer que l’empathie avec d’autres intelligences et la façon dont elles perçoivent le monde peuvent être presque impossibles à imaginer d’un point de vue humain », a déclaré M. Karmann.
Il convient de noter que le Paragraphica (bien qu’il ne s’agisse pour l’instant que d’un projet personnel) présente quelques limites. Il fonctionne mieux avec les paysages, étant donné qu’il exploite les données de localisation et les images de Street View. Cela signifie que le Paragraphica ne peut pas photographier des visages, des objets ou même des bâtiments. L’invite ne prend en compte que les scènes environnementales, bien que quelques ajustements de l’IA puissent éventuellement débloquer de nouvelles capacités. Pour l’instant, la caméra Paragraphica ne produit que des images carrées simples et ne peut pas prendre de vidéos, de panoramas ou même de photos de paysages ou de portraits.
Spécialiste jardin et bricolage, j’adore rédiger des articles qui aide les lecteurs à améliorer leur maison ! Souvent connecté, n’hésitez pas à poser vos questions !