dimanche 20 octobre 2024

~ Les erreurs de l'IA ~




La inteligencia artificial (IA) se ha convertido en una herramienta fascinante y poderosa, especialmente en el campo de la generación de imágenes. Sin embargo, es crucial que seamos críticos. Es decir, debemos analizar detenidamente las imágenes producidas por estas tecnologías a medida que exploramos sus capacidades, ya que podemos encontrar errores que, a primera vista, podrían pasar desapercibidos.

En este artículo analizaremos dos imágenes creadas por IA, relacionadas con representaciones de la naturaleza y creaciones del ser humano. Describiremos las características y errores que hemos encontrado y, además, hablaremos de la importancia de comprender cómo funcionan estas herramientas para maximizar su potencial. 

¿Estáis preparados para descubrir la complejidad de la IA generativa a través de la creatividad y la crítica?

 

ANALYSE DE LA PREMIÈRE IMAGE



Tout d’abord, il faut souligner que l’IA est un outil qui peut être efficace si nous savons comment l’utiliser. Dans cette activité, nous analyserons deux images créées par une IA générative et révélerons les erreurs que l’IA peut avoir commises.

En tenant compte de la première image, on peut constater que les proportions et structures sont bien créées, car nous voyons que l’on respecte les dimensions par rapport à la distance. Nous ne voyons rien de bizarre si nous regardons les magnitudes. Néanmoins, ce n’est pas le cas de la hauteur de la maison. Nous voyons que la porte principale est plus basse que la partie de derrière de la maison. Cela nous fait penser qu’il y a une grande marche à l’intérieur, ce qui est étrange pour une maison si petite, en tenant compte aussi qu’il y a deux fenêtres et qu’elles ne sont pas à la même hauteur. Nous pourrions penser qu’il y  a trois marches à l’intérieur, comme à l’extérieur, mais cela semblerait bizarre à cause de la fenêtre du milieu. Cela nous pouvons le comparer aussi avec la différence de hauteur et les différentes formes des deux vitres de la fenêtre de droite et les chaises de la table, qui sont clairement une erreur de l’IA. Nous constatons aussi qu’il manque une porte et nous ne voyons aucun indice de qu’elle existe. En résumé, on peut penser que c’est une erreur de l’IA qui fait que nous ne voyons pas l’image naturelle. 

En deuxième lieu, comme on ne voit pas tous les arbres qui sont derrière et au-dessus de la maison, on ne peut pas confirmer si l'ombre et la lumière sont une erreur, mais ils semblent naturels. Si nous nous concentrons sur les textures, nous pouvons penser qu'une maison qui a au-dessus matériel de pierre n’est pas du tout solide et viable, de la même façon que nous voyons que les pierres qui soutiennent la maison ne sont pas stables ni équilibrées, elles sont plutôt artificielles, car il y a des trous qui, dans la réalité, feront tomber la maison. Par exemple, nous voyons aussi un trou à la gauche de la maison, qui n’a pas de sens, car la maison n’est pas complète et, dans une situation réelle, elle serait en danger, à cause de la pluie ou en raison de la sécurité.

En troisième lieu, nous examinons les couleurs. Le ciel semble réel, avec des nuages et des couleurs naturels. Néanmoins, nous voyons un mélange de couleurs dans l’eau du lac qui ne semble pas naturel. Les plantes ont aussi des couleurs spéciales, car elles varient trop. Nous pouvons comprendre que cela est dû en raison du soleil, mais la couleur verte vive risque d’être anormal. 

D'un autre côté, il est important de savoir que chaque élément (fleurs, arbres) est composé d’une structure biologique, tout comme l’être humain. Les trois principales structures biologiques qui se démarquent sont les racines, les tiges et les feuilles. De plus, les fleurs, les graines et les fruits sont supplémentaires à ces éléments biologiques. 

Deuxièmement, il n’y a presque pas d’incohérences, bien que certaines limites soient observables. Dans les connexions et les alignements des éléments du bâtiment, ils ont un sens car les murs délimitent l’intérieur de l’extérieur. Et le toit qui surplombe également la pelouse

Bien que nous observions une architecture singulière, les portes, les fenêtres et les escaliers sont proportionnels à leur hauteur et à leur largeur. Ils sont également fonctionnels car ils sont idéaux pour ce type de maisons et ont leurs utilités. 

Troisièmement, nous observons plusieurs anomalies visuelles. Il y a une distorsion ou une déformation sur le bord droit de la porte, il y en a aussi une autre sur la paroi extérieure (au-dessus de la porte d’entrée) ; La vue à travers la fenêtre ’est un peu floue, en plus la rivière n’est pas très paisible, on remarque un obstacle à gauche de la porte d’entrée. En haut à droite de la maison, on voit une fenêtre qui n’est pas très distinguable. 

Pour conclure, lorsque nous analysons, l’image n’est pas caricaturale, mais plutôt réaliste et peut être loin de la fiction, une image typique de l’IA. Il est important de mentionner que les éléments végétaux ont un aspect qui correspond au printemps ou à l'été. En plus, il est crucial de comprendre qu’une photo peut sembler extrêmement naturelle et réelle si on ne fait pas attention aux détails, mais, si on l’examine de près, on peut discerner entre une photo réelle et une photo créée par l’IA.

 

ANALYSE DE LA DEUXIÈME IMAGE



Nous passons à la deuxième image. En premier lieu, nous voyons qu’il y a, plus ou moins, six maisons. À première vue, rien d’anormal. Cependant, quand nous y regardons de plus près, c’est clair que chaque maison à une magnitude vraiment différente. Les grandes maisons ne posent pas de problèmes, mais les petites semblent sortir d’un jeu vidéo, surtout celles-ci d’au fond, car, elles ne sont pas si loin pour les voir si petites. La même problématique arrive avec les arbres du fond de la première partie de l’image, car ils changent tellement la taille qu’ils semblent un jouet. Excepté ce que nous avons dit et le bateau minuscule, toutes les autres choses s’adaptent à la taille normale. Le même aspect nous arrive aussi avec la structure et la forme des détails; nous ne le voyons pas au début, mais ce n’est pas du tout naturel, à cause de la variation de dimensions et proportions des fenêtres des maisons, des escaliers, du toit de la maison et de l’orientation de chaque maison. 

D’un autre côté, ce qui est vraiment hors nature est l’ombre, en général. Il n’est pas clair que le soleil soit au nord et, de toute façon, les ombres ne reflètent pas la réalité de l’image. Ce que nous pensons qui est un peu plus réaliste est le matériaux dont tout est construit. Le bois de la maison et les pierres, même si une chose qui n’est pas claire est le bois qui soutient les maisons, car il n’a pas de sens. 

De même, les couleurs nous montrent qu’il y a quelque chose de très bizarre à l’image. Pour commencer, ce qui attire le plus l’attention est le lac, qui a l’air d’être une aurore boréale au lieu d’un lac. Les couleurs des arbres sont aussi frappantes et le ciel est complètement blanc.

Nous pouvons observer une prise de vue générale car nous voyons le paysage très clairement et au milieu d’un lac, nous voyons deux îles. Lorsque nous fixons l’île en arrière-plan (au fond), elle n’est pas trop lisible tandis que celle en face de nous a plus de valeur car elle est présentée avec plus de visibilité qui nous permet de voir quelques détails.

Nous voyons les arbres de différentes couleurs, (jaune, vert,ect..) ce qui nous amène à penser au printemps, le ciel, avec sa couleur plus claire en arrière-plan, se reflète sur les eaux, ce qui donne une touche particulière au lieu, ce qui met en valeur un style du lieu. En effet, les maisons ne sont pas directement au sol, mais soutenues par du bois, le sol est en pierres. Les maisons ne sont pas alignées, elles ont la même couleur et sont construites de la même manière. Un autre élément qui semble incohérent dans l’image, ce sont les toits des maisons, des herbes poussent dessus, c’est comme s’ils avaient été construits avec des pierres ou des murs. Ces détails nous montrent que la partie incohérente est logique parce que l’architecture est correcte pour le lieu.

Deuxièmement, les escaliers ne sont ni fonctionnels ni proportionnels, car nous observons un escalier devant une fenêtre, ce qui n’est pas logique du tout. L’une des anomalies visuelles se situe au niveau de l’escalier tordu.

Enfin, il est facile de croire que l’image que nous venons d’analyser est réelle car elle contient des éléments que nous connaissons dans la vraie vie. Il ne fait aucun doute que ces images sont typiques de l’IA.


RÉFLEXION SUR LES DYSFONCTIONNEMENTS DES IA GÉNÉRATRICES D'IMAGES




De manera general, observamos un funcionamiento artificial en estas IA. Este sistema informático nos sirve para realizar muchas tareas; es un medio capaz de modificar cualquier cosa que deseemos ver a la perfección. No obstante, sigue siendo una máquina que requiere de intervención humana para transformar y crear.

Además, es importante comprender el funcionamiento y la relevancia de la IA, ya que realiza tareas humanas como una ayuda para obtener mejores resultados. Aun así, podemos identificar un trabajo o una creación de IA porque contiene ciertas particularidades que la distinguen de cualquier otro dibujo o caricatura, y es esto lo que hace que esta inteligencia artificial sea destacable e incomparable. En las imágenes encontramos, por ejemplo, algunos fallos, como objetos torcidos, mal posicionados, o construcciones arquitectónicas no muy lógicas, etc.

Los errores más frecuentes que observamos en estas imágenes son problemas de seguridad, ya que la IA puede exponer datos sensibles, lo que indica que no maneja adecuadamente las medidas de protección. Otro problema es que la IA genera informaciones incorrectas con mucha confianza, lo cual puede resultar engañoso.

Al final de este artículo os mostramos diferentes imágenes que hemos creado basándonos en las imágenes propuestas para el trabajo. En estas, podemos comprobar que, a pesar de que le mostremos todos los errores cometidos a la IA, seguirá cometiendo errores, sean estos que le hemos mostrado o sean nuevos. Es por esto que debemos aprender poco a poco cómo tenemos que tratar a la IA, sus puntos débiles y sus puntos fuertes, para poder vencer los obstáculos y sacarle el máximo partido.

A medida que explicamos los detalles de las imágenes, también abordamos las razones por las cuales creemos que existen estos errores y cómo identificarlos, así como su origen. Es muy fácil pensar que la IA es perfecta si no prestamos atención a los pequeños detalles. ¿Habías notado todos los errores antes de examinar la foto en detalle? Sabemos que la respuesta es no. 

La lección que extraemos de esta actividad se basa en la importancia de revisar el contenido generado por una IA y de entender sus limitaciones. Estamos convencidos de que es posible adaptar, mejorar y corregir sus producciones. Por esta razón, le hemos pedido a ChatGPT que cree nuevas imágenes similares, dándole instrucciones precisas para corregir los errores.

Hemos utilizado la versión de “generador de imágenes” de ChatGPT. Le hemos mostrado lo que queremos y todos los errores encontrados basados en las proporciones de la casa, elementos faltantes, estabilidad de la estructura, vegetación, sombras y colores para que no los repitiera. Hemos creado diferentes versiones y, sin duda, las grandes diferencias son claramente visibles. Es esencial entender que la IA reacciona de manera diferente según las órdenes que le damos. Sin embargo, hay que destacar la importancia del CÓMO interactuamos con la IA. Hay que darle un contexto, explicarle lo que queremos y, sobre todo, corregirle sin miedo.

Por añadidura, cabe resaltar que hemos generado todas las imágenes que aparecen en este artículo. Le hemos pedido al generador de imágenes de ChatGPT lo que necesitábamos, en que nos basábamos y los detalles. Además, le hemos corregido varias veces, ya que no siempre nos mostraba exactamente lo que esperábamos.

¿Qué tipos de errores has observado en tus propias experiencias con la IA? ¡Intenta crear imágenes con la IA dándole instrucciones claras y comparte los resultados con nosotros!

¿Qué opinas? ¿Puede la IA realmente simplificar nuestra vida diaria? ¿Es posible corregirla para obtener resultados perfectos? ¡Esperamos tus opiniones!

Aquí están nuestras creaciones:












Para finalizar, queremos mostraros que no es oro todo lo que reluce... Nos hemos encontrado con diferentes obstáculos que nos impedían seguir con este proyecto. Como la siguiente limitación de ChatGPT:




A pesar de los obstáculos, hemos podido finalizar el proyecto. Hemos creado diferentes cuentas de ChatGPT para evitar las limitaciones de este y ha funcionado.





JESSICA MICHEL
LAURA GARCÍA ÁLVAREZ

jeudi 17 octobre 2024

~ Les biais de l'IA ~


Le test du baiser

    Nous nous sommes intéressés aux biais que pouvaient présenter les intelligences artificielles dans la production d’images, si développées soient-elles aujourd’hui. Pour cela, nous avons réalisé une expérience avec l’IA DALL-E, une extension de ChatGPT, qui, en plus de générer des images à partir de données textuelles (appelées les invites), peut créer plusieurs variantes de ces images en s’inspirant de l'originale, effectuer des modifications ciblées et réalistes et enfin télécharger les rendus sur nos appareils.


    Notre expérience, appelée «Le test du baiser», visait à générer des images de deux êtres humains qui s’embrassaient. Nous avons commencé par donner à DALL-E l’invite «photo de studio de deux êtres humains qui s’embrassent». Le résultat fut plutôt décevant car malgré la réalité apparente des deux personnes, elles ne s'embrassaient pas vraiment :
photo de studio de deux êtres humains qui s'embrassent

Nous avons donc modifié légèrement l’invite, à savoir «photo de studio de deux êtres humains qui s’embrassent sur la bouche». Cependant, l’IA n’a pas pu créer les images pour des raisons de sécurité car ce n’était pas un «contenu sécurisé». Nous avons donc réitérer l’exercice avec la commande «deux êtres humains qui s’embrassent», et là, le résultat était plutôt convaincant, en voici deux exemples :

deux êtres humains qui s'embrassent
deux êtres humains qui s'embrassent


Ensuite, nous demandons à l’IA de générer de nouvelles images avec l’invite «deux êtres humains qui se font un bisou», qui ressemblent très fortement aux images précédentes, excepté le décor. Si l’on demande à DALL-E de générer des images en lui disant «deux amoureux qui s’embrassent», c’est encore sensiblement le même type de personne qui apparaît, avec la même position et plus ou moins le même décor.

deux êtres humains qui se font un bisou
deux amoureux qui s'embrassent

Nous constatons que toutes ces images sont similaires, l’intelligence artificielle reprend toujours la même constante, le décor est le même, la position des personnages varie légèrement ou pas du tout, et les deux êtres humains semblent identiques tout le long de l’exercice : un brun aux cheveux courts et une blonde aux cheveux longs. Pour essayer de modifier l’une des variantes, nous demandons à l’IA de générer «deux amoureux qui s’embrassent, à la maison» : le résultat varie légèrement, c’est toujours le même type de personne, mais le décor change. Il faut donc faire preuve d’une précision extrême afin de vouloir générer l’image voulue.

deux amoureux qui s'embrassent, à la maison

Nous avons conscience que lorsque l’on génère des images via une IA, certaines anomalies ou bizarreries peuvent apparaître. Dans ce test du baiser, nous nous attendions à en retrouver certaines, notamment dans les détails corporels car les IA ont souvent du mal à représenter les interactions humaines complexes (malformations des membres comme les mains, des visages déformés dans les zones de contacts,...). À notre grande surprise, DALL-E a plutôt bien réussi à représenter nos deux êtres humains. Il est vrai que sur certaines images, nous n’avons pas réellement l’impression que nos deux sujets s’embrassent, les lèvres ne sont pas ouvertes par exemple. Ces erreurs sont sans aucun doute liées à la difficulté de l’IA à comprendre la dimension physique et les interactions des corps humains. Quant aux positions corporelles, l’IA a tendance à générer des poses stéréotypées, où les corps semblent figés dans des postures très conventionnelles : dans nos exemples, les mains de la femme sur le torse de l’homme ou bien ce dernier, plus grand que la femme. Cela montre que l'IA se base sur des modèles standards de relations humaines, plutôt que d’adapter les images à la variété des contacts humains possibles.

Un autre biais qui nous semble important d’aborder est que l’IA peut avoir tendance à générer des couples hétérosexuels et caucasiens par défaut. Cependant, si on lui demande de générer un couple homosexuels avec par exemple l’invite “deux hommes qui s’embrassent” ou “un couple d’origine africaine qui s'embrasse”, elle y arrive tout à fait. Ceci s’explique par le fait que les IA génératives ont tendance à présenter des biais reflétant les données sur lesquelles elles ont été entraînées. La représentation des hommes et des femmes générées dépend également du modèle. Toutefois, il arrive, dans de nombreux cas, qu’il y ait un léger biais vers des figures féminines plus sexualisées dans les représentations, ce qui engendre des stéréotypes de ce genre (par exemple, une robe, du maquillage ou des fleurs dans les cheveux).

Enfin, les zones de contact physiques ont plutôt bien été représentées (les mains sur le corps), malgré la difficulté de l’IA à générer des interactions corporelles réalistes. De plus, le regard des personnes est un aspect délicat, car dans la réalité, il joue un rôle central dans l’expression des émotions et des intentions. En effet, les IA ont souvent du mal à saisir ce trait subtil, c’est pour cette raison que les regards sur les images peuvent sembler vides ou bien déconnectés de l’action en cours. Il peut même arriver que les yeux des personnages ne se rencontrent pas, c’est d’ailleurs notre cas sur toutes les images que nous avons générées !



    Nous allons maintenant aborder la notion de réalisme à travers l’IA. Par rapport aux images que nous avons imaginées au cours de nos recherches, nous remarquons que les images créées demandant du réalisme ont encore un filtre qui est très singulier aux Intelligences Artificielles. Nous voyons un filtre qui rend les images trop parfaites, trop lisses, qui n’est pas en lien avec la demande de réalisme. Sur certaines images la lumière ne semble pas réaliste, l’IA a peut-être voulu trop en faire, mais au final, nous avons une réalisation qui ne rend pas bien à l'œil. Le point le plus frappant dans les images données sont les images des footballeurs dits “ réalistes”. Nous avons l’impression que l’IA a plutôt réalisé des photos pour un jeu vidéo en développement avec des amas de lumières qui n’ont aucun rapport avec le réalisme demandé dans nos recherches. Cependant il faut souligner que pour une réalisation d’images en quelques secondes, l’IA réalise quand même des images impressionnantes, d’autant plus que nous ne sommes qu’aux prémices des intelligences artificielles. Quant aux restrictions de l’IA sur ce qui pourrait être du contenu à caractère sexuel ou trop explicite, nous avons eu un message d’erreur lié à l’invite suivant : “photo de studio de deux êtres humains qui s’embrassent sur la bouche”.

En effet, l’IA a prétexté un contenu qui était sécurisé et qu’elle ne pouvait donc pas générer les images, sachant que notre invite de base était “photo de studio de deux êtres humains qui s’embrassent”, nous pouvons donc interpréter que la notion de “bouche” est trop explicite pour l’IA et qu’elle est obligée de se restreindre au plus tôt possible dans la recherche.

Lors de recherches répétées avec le mot “bouche” pour un baiser, il est vrai que nous avons seulement eu des messages d’erreur nous signifiant que nous enfreignons les limites de l’IA, mais nous n’avons eu aucun risque pour notre utilisation. Si nous essayons l’invite avec une autre IA comme ArtGuru, le baiser sur la bouche n’est pas interdit, mais l’image est bien moins réaliste et comporte des erreurs flagrantes :
photo de studio de deux êtres humains qui s'embrassent sur la bouche


Nous avons aussi comparé les limites de l’IA quant aux armes, et sur DALL-E nous avons pu rechercher, une AK-47, un militaire avec une AK-47 et nous avons eu des résultats,tandis qu’en cherchant un Desert Eagle ou un militaire avec un Desert Eagle (screen), l’IA nous a dit qu’elle ne pouvait pas générer ces images. Cela nous amène à nous interroger sur ce qui dérange l’IA dans la réalisation d'images, vu que dans ce cas, nous avons juste l’arme qui change. Une AK-47 ne choque pas l’IA mais le Desert Eagle, si, ce qui est un peu dérangeant dans la compréhension de la limite. Au final, nous remarquons une différence avec les images venant de DALL-E qui sont beaucoup plus strictes, là ou ArtGuru n’a pas de limite lors de recherches qui pourraient sembler plutôt classiques, tels que les baisers ou les armes.

recherche ak-47 avec DALL-E

recherche desert eagle avec DALL-E




    En conclusion, notre expérience avec DALL-E, "Le test du baiser", montre à la fois les prouesses et les limites actuelles des IA génératives dans la création d'images réalistes. Si l’IA parvient à produire des rendus visuellement convaincants et à gérer des interactions humaines complexes comme les contacts physiques, elle est encore influencée par des biais inhérents à ses données d’entraînement, reproduisant souvent des stéréotypes en matière de diversité et de genre. De plus, certaines restrictions liées au contenu, notamment sur des thèmes comme le baiser ou les armes, révèlent une gestion des limites parfois surprenante et incohérente. Ces résultats, bien que prometteurs, soulignent que les IA sont encore en phase de développement et nécessitent une précision accrue pour offrir des rendus totalement réalistes et diversifiés.


OB & LG