dis-moi/dime: Les erreurs de l'IA

Au fil du temps, l’IA est devenue de plus en plus intelligente et utilisée, en devenant capable de produire des images très réalistes et naturelles, ce qui n’est pas seulement impressionnant, mais franchement assez effrayant. Mais est-ce que les IA peuvent vraiment produire des images hyper-réalistes ? Ou ces images contiennent-elles des petites erreurs et imperfections ? Dans cet article, je vais explorer la capacité de l’IA de créer des images à partir d’une invite, et analyser si elle peut vraiment capturer l’essence de la photographie réelle.

On commence avec cette première image ici. L’image présente une maison de style organique, en harmonie avec la nature et bordée par une végétation dense. Au premier regard, on peut voir qu’elle semble très réaliste et correcte, sans trop d’erreurs. Par exemple, les couleurs des arbres et de l’eau reflètent une scène de belle nature et, en général, les proportions de la maison au centre correspondent à une structure réelle. Les portes et fenêtres sont bien intégrées et sont globalement réalistes, et les courbes des portes en arc ajoutent à ce sentiment. Elles, avec les escaliers, sont bien proportionnées et généralement cohérentes. La seule chose qui pourrait être considérée problématique est le toit - le fait qu’il soit végétalisé n’est pas trop réaliste, étant donné qu’en réalité, un toit recouvert presque entièrement de végétation ne fonctionnera pas en raison du poids. Dans l’ensemble, toute de l'image paraît très naturelle et donne l’impression qu’elle pourrait être réelle : les couleurs avec des verts vibrants et des tons doux pour le ciel rendent l’image plus complète, avec aucun sens d’artificialité.

Cette deuxième image montre un groupe de maisons rouges dispersées sur plusieurs petits îlots rocheux, entourées par une eau calme. Il y a un sentiment automnal et vibrant. Les ombres des arbres semblent cohérentes, et les couleurs de l’image sont globalement correctes, ce qui ajoute plus à l’ambiance automnale et sereine. Cependant, ce cadre idyllique contient plus d’erreurs, même s’ils sont petits. Par exemple, quant aux proportions des maisons, on voit que, par rapport aux fondations sur lesquelles elles reposent, certaines parmi elles apparaissent trop grandes pour les petits îlots. De plus, la maison au premier plan semble un peu mal alignée sur son rocher, avec un escalier qui ne mène nulle part. En outre, l’image dans son ensemble a un sentiment un peu trop parfait. Les arbres, par exemple, ne semblent pas trop naturels car ils, avec la végétation, sont assez uniformes en arrière-plan.

Après avoir vu ces deux images, j’ai décidé de faire une petite expérimentation avec l’IA génératrice d’images ChatGPT. Je lui ai donné plusieurs invites pour créer des images différentes afin de pouvoir analyser les erreurs les plus fréquentes dans le but de commencer à comprendre les raisons pour lesquelles ces erreurs peuvent se manifester. Tout d’abord, je lui ai donné des invites assez courtes, comme ‘Créez une image d’une maison dans un forêt’ et ‘Créez une image d’un paysage urbain en France’, et voici les créations :

Même si ces images ne semblent pas trop naturelles, l’IA avait la liberté de faire n’importe quoi avec mon invite, et a réussi à créer des images qui correspondent plus ou moins à ce que j’ai demandé. J’ai ensuite ajouté plus d’éléments dans mon invite; pour la première, en décrivant le toit, le paysage, le ciel etc.; pour la deuxième, en décrivant les caractéristiques de la rue et des choses que j’ai voulu inclure. Voici les créations :

Ce que je trouve intéressant, c’est le fait que, en étant plus précis avec mes instructions, ChatGPT ait été plus capable de me donner une image correcte et naturelle, sans beaucoup d’erreurs. J’ai aussi créé d’autres images, que je n’ai pas inclus ici, et elles ont suivi une tendance similaire. Donc, en général, les erreurs les plus fréquentes étaient celles par rapport au texte. Les IA ne peuvent pas écrire du texte dans une langue cohérente, et utilisent souvent des symboles au lieu de mots, ou écrivent des mots complètement bizarres, ce qui nuit à l’authenticité des images produites. Aussi, les IA ont du mal à générer des mains ou des visages ‘correctes’, souvent ajoutant un doigt ou fusionnant des objets ensemble. Ces erreurs peuvent être causées par une confusion avec plusieurs concepts, ou même un manque de connaissances de la part de l’IA, et cela peut vraiment impacter sur la crédibilité de l’image. Sur les réseaux sociaux, on voit de plus en plus d’images générées par l’IA qui deviennent ‘virales’ et qui mènent beaucoup de personnes à les croire, ce qui est vraiment dangereux pour notre société. Quelquefois, comme on a vu, les erreurs ne sont pas forcément visibles, ce qui cause encore plus de confusion et de problèmes. C’est difficile de penser à des solutions concrètes, étant donné que l’IA est un outil assez nouveau qui change et améliore soi-même chaque jour. Cependant, on peut ajouter des étapes d’évaluation pour que les IA puissent filtrer les erreurs et les anomalies avant de générer une image, ou on peut les encore entraîner, mais cela pourrait donner lieu à plus de dangers et de choses encore inconnues.

Pour conclure, il est évident que les IA génératrices d’images peuvent être très utiles et qu’elles peuvent générer des images cohérentes et naturelles, mais il faut toujours rester critique et conscient des dangers qu’elles peuvent poser. Comme on a déjà vu, les erreurs peuvent être très subtiles et si on les partage à grande échelle, il pourrait y avoir des conséquences graves pour la société.

- Tarun Maybanks

vendredi 17 janvier 2025

Les erreurs de l'IA

Aucun commentaire:

Enregistrer un commentaire