Nous sommes déjà bien habitués à l’apparition de ces mélanges improbables, ces images fascinantes générées à l’aide de diverses intelligences artificielles, animations chargées de surréalisme et de psychédélisme. Le tout, plutôt loin d’un réalisme quelconque. Nous vous en avons déjà parlé ici, , ou . Elles utilisent des technologies aux noms rigolos comme DALL-E 2 d’OpenAI, Stable Diffusion, Disco Diffusion ou Midjourney de StabilityAI, et se sont rapidement répandues dans les internets via Instagram. Il est maintenant question d’obtenir des résultats plus réalistes. Mais comment ? L’Université de Boston et Google ont fourni les réponses, et L’IA Google DreamBooth est là.

Aerosmith.

Des capacités fort réjouissantes pour l’artiste IA Roope rAInisto, rapidement exploitées avec son sens de la dérision et de la critique. Il en publie les résultats sur son compte instagram never_ever_never_land. Ce finlandais, qui écrit son nom avec "AI" en majuscules et que Brainto suit depuis un certain temps, nous avait déjà expliqué le pourquoi et le comment de ses expérimentations IA. Voici donc, par son intermédiaire, une bonne démonstration de la puissance naissante de DreamBooth dans cette série joyeusement absurde : « Jim Carrey partout », suivie d’autres expériences tout aussi réjouissantes. Et en plus il nous l'explique gentiment !

Oasis.

Roope rAInisto : " Jim Carrey est l'un des meilleurs acteurs de sa génération. Il est difficile de trouver quelqu'un qui soit capable de jouer à la fois des rôles comiques et dramatiques. J'ai donc pensé que, puisqu'il est si doué pour tout, il serait également doué pour être le leader de tous les groupes du monde - pourquoi pas ? "

Rolling Stones.

Roope rAInisto : " Il est désormais possible d'enseigner assez facilement à une intelligence artificielle une nouvelle idée, quelque chose qu'elle ne connaît pas encore. Il existe une chose appelée "Dreambooth training", qui permet d'intégrer un nouveau concept dans l'IA. Vous lui montrez un tas d'images d’un objet, de la personne ou de tout ce que vous voulez lui apprendre, et après un certain entraînement, elle est capable de créer des images à partir de ce qu’elle a appris. Dans mon cas, j'ai montré à l'IA un tas d'images de Jim Carrey, et maintenant elle est capable de mettre "Jim Carrey" dans tout, partout où je souhaite qu'il apparaisse. L'IA sait déjà à quoi ressemblent "normalement" tous ces groupes, elle est donc capable d'insérer Jim dans le style de chaque groupe. " 
(Et bien sûr dans chaque membre du groupe, c’est ça qui est rigolo).

C'est qui ?

Roope rAInisto : " Cette IA connaît donc déjà "Jim Carrey", elle a été entraînée avec toutes sortes d'images, de bonne ou de mauvaise qualité, de sorte que les résultats globaux ne sont pas très bons si j'essaie de créer des images normalement. Mais je peux "utiliser" ou "recycler" ce que l'IA a appris de Jim Carrey sur des images de meilleure qualité. 

À vous de retrouver…

Vous avez compris ? C’est simple, DreamBooth a la capacité de reconnaître le "sujet" d’une image, de le déconstruire de son contexte d’origine, puis de le synthétiser avec précision dans un nouveau contexte. Et, cerise sur le gâteau, il peut être utilisé avec les autres générateurs d’images IA actuels. C’est en quelque sorte un outil de “détourage total” ultra-malin qui apprend son “sujet” détouré sous toutes les coutures. Il permet aux utilisateurs de mieux contrôler l’image du sujet, puis de contrôler le modèle de diffusion à l’aide d’entrées textuelles comme une IA classique. Ce qui veut dire en clair : par la suite DreamBooth peut également afficher le "sujet" sous différents angles de caméra, ou créer d’autres ambiances, accessoires, expressions faciales ou changements de couleur suivant des "ordres" en texte que vous lui adresserez.

Pour résumer : l’objectif principal du modèle est de fournir aux utilisateurs les outils nécessaires pour créer des représentations photoréalistes du sujet choisi et les connecter au modèle de diffusion texte-image. Tentant, non ?

Enchaînons avec quelques autres exemples d’images photoréalistes produites par ce cher Roope rAInisto, avec souvent une idée de sens critique derrière la tête. 
Roope rAInisto : " Cette série sur les salles de bain, c'est un commentaire sur la richesse et la technologie. C'est comme le rasoir Gillette qui a maintenant 5 lames. 5 est mieux que 4, non ? C'est obligé. Donc une salle de bain avec 4 douches est mieux qu'une avec 3. 10 bouteilles de savon sont meilleures que 9. Les gens cherchent à s'améliorer constamment et à trouver “la meilleure solution” à tout, et ces images tentent donc d'être un commentaire à ce sujet. " 

Ou encore cette série de voitures, soit hybrides, soit en feu :

Roope rAInisto : " Les voitures sont des symboles intéressants de richesse, de pouvoir et de statut. Des objets mécaniques dans des endroits où ils ne devraient pas vraiment se trouver (la nature). De plus, elles peuvent parfois être détruites. On voit rarement des voitures en feu, mais on devrait le voir plus souvent. Toutes les voitures seront détruites. "

Pour finir, l'ami Roope rAInisto vous recommande le travail du français Rémi Molettee qui mélange allègrement danse et IA.