Quelle est la chose la plus étrange que vous puissiez imaginer dans votre esprit? Essayez-le, le plus étrange sera le mieux. Que diriez-vous d’un ananas chevauchant un T Rex vêtu d’un pyjama rayé bleu et d’un casque Viking lors d’un Rodéo?
Il faudrait des efforts raisonnables pour dessiner une telle chose, et encore moins en faire une photographie, même avec des compétences Photoshop supérieures. Mais Google vient d’annoncer que ses nouveaux programmes d’IA texte-image, curieusement, appelés Imagen, peuvent le faire en un clic de bouton.
Google dit que leur programme bat tous les concurrents tels que Dall-E, et peut créer des « photographies » incroyablement réalistes d’à peu près n’importe quoi. Alors, comment ça marche?
Eh bien, comme les autres programmes d’IA texte-image, il fait ce que cela ressemble. Vous entrez une description de quelque chose par texte, par exemple, “une photo d’un chat persan portant une chemise rouge, jouant de la guitare sur une plage” et le programme fera le reste pour vous. Google a exposé plusieurs exemples sur sa page Facebook et les résultats semblent en effet impressionnants. Cependant, ceux-ci peuvent ne représenter que la crème de la crème en termes de qualité d’image.
Maintenant, dans un geste un peu inhabituellement responsable, Google a prévu le côté obscur de ce type d’IA et a refusé de publier le programme à l’usage du grand public. Le potentiel de mal, je veux dire, est trop grand apparemment.
Imagen explore Internet à la recherche d’informations pour apprendre et créer des images. Parce qu’Internet peut être rempli de stéréotypes et de préjugés, ceux-ci finissent par devenir présents dans la société. Google a déclaré que les préjugés comprenaient une préférence pour les tons de peau plus clairs et certains stéréotypes de genre occidentaux.
« Les méthodes génératives peuvent être utilisées à des fins malveillantes, y compris le harcèlement et la diffusion de désinformation, et soulèvent de nombreuses préoccupations concernant l’exclusion sociale et culturelle et les préjugés”, selon un article publié par Google. ”En tant que tel“, poursuit le rapport, « il existe un risque qu’Imagen ait codé des stéréotypes et des représentations nuisibles, ce qui guide notre décision de ne pas publier Imagen pour un usage public sans autres garanties en place.”
Alors, à quoi servent ces programmes d’IA, en particulier s’ils ne sont pas rendus publics? Eh bien, les modèles d’apprentissage texte-image montrent la puissance des systèmes d’apprentissage automatique. Dans ce cas, Imagen élimine le besoin de savoir utiliser un logiciel spécialisé comme Photoshop pour créer des images abstraites. Google espère qu’à l’avenir, les gens pourront utiliser les ordinateurs et les logiciels de manière extrêmement intuitive, sans avoir à apprendre les systèmes et les logiciels en premier lieu.
Maintenant, cela ne remplacera pas la photographie de sitôt, alors ne vous inquiétez pas. Mais imaginez (si vous voulez) un moment où vous pourriez faire tout ce que vous vouliez dans Photoshop simplement en disant à l’ordinateur de le faire. Je ne sais pas si c’est une idée utopique ou non, mais c’est certainement une idée intéressante. Je ne sais pas pour vous, mais je pourrais certainement bénéficier de l’utilisation de AfterEffects sans avoir à passer des heures à l’apprendre au préalable.