De simples instantanés, soi-disant pris « à la volée » avec un iPhone, ont récemment semé le doute sur la capacité à détecter l’IA dans nos fils d’actualité. Il ne s’agit cependant pas d’une simple génération sur un outil grand public.
Début 2025, des photos de cette jeune femme ont fait le tour des réseaux sociaux, présentées comme la preuve ultime que la création par IA générative est désormais indétectable pour le commun des mortels. Et on ne peut le reconnaître qu’en voyant les photos : elles sont superbes.
Le cocktail utilisé par dal_mac sur Reddit est ce qui fonctionne le mieux pour tromper les gens : des photos classiques et peu artistiques qui auraient pu être prises par n’importe qui. Ils ne sont pas très beaux, pas très bien cadrés et leur côté photo prise sur place donne un air de déjà vu à toute la série. Tout le monde s’est déjà pris ou s’est fait prendre en photo, en randonnée, devant une belle bâtisse en pierre.
La touche finale est donnée par un style des plus trompeurs lorsqu’il s’agit d’images générées par l’IA : la photo « iPhone ». Notre œil est habitué à reconnaître le grain, les contrastes et même les défauts des photos prises par les smartphones Apple, au fur et à mesure qu’elles inondent les réseaux sociaux. Même au-delà d’Apple, rendre une photo réaliste » prise par un smartphone » est une chose plus facile que de simuler le lauréat d’un prix Hasselblad : nous savons reconnaître ce style mainstream, dont nous n’avons guère de doute.
La même jeune femme au restaurant
Toujours pareil en promenade
La jeune femme existe, tout le reste est généré
Mais cette affaire cache une autre histoire, un peu plus technique, qui montre surtout que la compréhension des possibilités de l’IA n’est pas encore parfaitement maîtrisée par tout le monde : oui, la jeune femme sur ces photos existe. Il n’a pas été généré par une IA. Ce n’est pas un rapide tapé avec beaucoup de succès sur Midjourney, ChatGPT ou Grok, mais une belle utilisation de Flux, un outil d’IA générative qui peut être exécuté localement et qui a la particularité de donner un contrôle suffisant à l’utilisateur pour obtenir des résultats cohérents sur plusieurs générations.
Ainsi, l’auteur de la série explique avoir « repoussé les limites de Flux » en appliquant successivement deux modèles formés sur la génération de ce visage et sur le style des photos prises avec un iPhone. En combinant ces deux modèles restreints avec un modèle de plus grande génération, il parvient à ce résultat, qu’il continue de travailler afin de le rendre encore plus réaliste. Comment le modèle utilisé a-t-il réussi à créer et maintenir une cohérence sur ce visage féminin ? Et bien tout simplement parce que la personne sur les photos existe : le sous-modèle » visage » a été formé avec 20 vraies photos d’une personne réelle.
Une expérience dans l’émission Unlock
Ce sujet de la plausibilité des créations générées avec l’IA a été abordé par Numerama et Frandroid dans l’émission Unlock. Pour la séquence, Robin, vidéaste de Frandroid, avait préparé des images vraies et fausses et mis le plateau et le public au défi de détecter laquelle était laquelle. Les images générées par l’IA étaient des variations d’images réelles, modifiées entre 40 et 60 % par un modèle exécuté localement – plus ou moins la même technique que celle utilisée pour le « la femme qui n’existe pas ».
Nous avons été époustouflés par ce que nous avons vu et nous n’avons clairement pas obtenu la bonne réponse à chaque fois – les téléspectateurs non plus. Vous pouvez revoir la séquence dans le clip vidéo ci-dessous et jouer au jeu avec nous.