jeudi 26 décembre 2024

REPRÉSENTATION DE LA NATURE ET DES CONSTRUCTIONS HUMAINES

Les images générées par intelligence artificielle sont globalement fascinantes et réalistes. Cependant, avec un regard plus attentif, ils révèlent des incohérences, que nous rappellent que la technologie a encore des limites. J’ai tenté de faire une analyse approfondie à fin d’identifier les défauts. 

Pour commencer, les proportions des objets et des structures dans les images générées ne sont pas toujours réalistes. Par exemple, dans la première image, une grande fenêtre avec une arche semble beaucoup trop large pour l’épaisseur du mur qui la supporte. De la même manière, les meubles paraissent trop petits par rapport à la taille de la maison, créant une disharmonie. En plus, les escaliers ont des dimensions disproportionnées et ils semblent peu fonctionnels dans la réalité.

En outre, par ce qui concerne à l’éclairage et les ombres, la lumière principale semble provenir de la droite mais il n’y a pas certaines ombres essentielles ou parfois, ils sont incohérents. Par exemple, sous la table l’ombre est presque inexistante ou les rochers devraient projeter des marquées, et cela li manque de profondeur.

Par ailleurs, les textures des matériaux manquent souvent de diversité et de naturel. Les pierres et les murs blancs, par exemple, paraissent trop uniformes, presque artificiels. Dans les toits, les herbes et les plantes donnent parfois l’impression d’avoir été "collées" sans intégration.

Un autre point problématique concerne les perspectives et les angles des structures puisqu’ils révèlent des irrégularités. Par exemple, des escaliers semblent légèrement "flotter" au-dessus du sol, tandis que certaines maisons paraissent inclinées de manière étrange ou avec zones planes.

En ce qui concerne les couleurs des éléments naturels, leur saturation est excessive. La verdure, par exemple, est tellement vive et uniforme et l’eau manque de détails comme des reflets ou des ondulations réalistes.

Les éléments végétaux, en particulier les arbres et les plantes grimpantes ont des problèmes parce qu’ils sont trop symétriques, et il manque des irrégularités naturelles pas comme dans la réalité.

Enfin, les joints et les raccords entre les différents éléments de construction révèlent des incohérences. Par exemple, les maisons semblent souvent "posées" sur les rochers sans intégration, en l’absence de fondations visibles ou de fissures autour des structures.

Face à ces observations, il semble que l’IA rencontre des difficultés à intégrer des éléments naturels avec les éléments de constructions. Cela provient des limites dans la compréhension du monde physique. Elles se contentent d’imiter des grandes bases de données d’images, sans comprendre les lois de la physique et les relations logiques entre les objets.

Comprendre et identifier les erreurs dans les images est essentiel pour préserver la crédibilité des contenus visuels. Les incohérences peuvent réduire l’impact d’une image et compromettre son utilisation, notamment dans l’architecture, le design ou la publicité. De plus, analyser ces imperfections contribue à améliorer les outils d’intelligence artificielle, en aidant à repérer les failles et à affiner leurs algorithmes.

Par ailleurs, développer un esprit critique face à ces images est une compétence précieuse dans un monde. Apprendre à détecter les anomalies permet d’éviter de se laisser berner par des visuels impressionnants mais trompeurs.

Les erreurs les plus courantes dans ces images incluent des proportions incohérentes, une mauvaise gestion des ombres, des textures artificielles, des perspectives incorrectes et des artefacts visuels tels que des flous. Ces problèmes proviennent généralement de la complexité des scènes et des limites des algorithmes actuels.

 

Pour approfondir la réflexion sur la récurrence de ces anomalies, j’ai demandé à une IA générative d’images de créer une image représentant un paysage. À première vue, cette image m’a semblé encore plus irréaliste que les deux autres analysées précédemment.


Les proportions semblent globalement bien respectées, mais certains éléments, comme les escaliers ou les colonnes en bois qui soutiennent les maisons, apparaissent disproportionnés, trop fins ou trop hauts. L’éclairage général est cohérent, mais des ombres importantes manquent, notamment sous les maisons et les arbres, ce qui donne une impression d’irréalisme.

En ce qui concerne les textures, le toit et les autres surfaces manquent de variations naturelles, comme des fissures ou des imperfections, ce qui renforce l’aspect artificiel de l’image. Les structures, en particulier, donnent l’impression de flotter, sans intégration cohérente avec leur environnement.

Les couleurs sont plus trop saturées, avec une absence notable de reflets naturels et de variations de vert. Les arbres et les plantes semblent trop parfaits, sans ramifications naturelles, et affichent une régularité artificielle. Par ailleurs, les portes et les fenêtres manquent de profondeur et de détails réalistes, tels que des reflets ou des marques d’usure.

En synthèse, cette image présente des erreurs similaires à celles relevées dans les précédentes analyses. Ces répétitions montrent que ces problèmes ne sont pas isolés, mais qu’ils sont bien caractéristiques des limitations actuelles des IA génératives d’images.

 

Pour remédier, je crois que, tout d’abord, il doit enrichir les bases de données utilisées pour l’entraînement des IA avec des images plus variées et plus complexes pourrait améliorer leur capacité à reproduire des environnements réalistes. Ensuite, intégrer des contraintes physiques, comme les interactions naturelles entre les objets, aiderait à éviter certaines incohérences structurelles. De même, développer des algorithmes capables de calculer les ombres et les lumières en fonction de leur source permettrait d’améliorer la gestion de l’éclairage.

Pour conclure, il est essentiel que chacun développe un regard critique face aux images générées par IA. Prenez le temps d’observer les détails, d’analyser les perspectives et de comparer ces créations à la réalité. Les IA génératrices d’images sont prometteuses, mais leur potentiel ne pourra être pleinement exploité qu’avec une analyse rigoureuse et une amélioration continue de leurs capacités. 

 

Laura Sancho 

dimanche 15 décembre 2024

~ Humour et BD ~



D'abord, il faut remarquer que j'ai essayé d'utiliser différents ChatGPT, comme Master ACG (Anime, Comics/Manga, Game), AI Comic Maker, Comic Book Image Creator et Comics Art Creator, pour la création des images de la BD, mais finalement j'ai utilisé le générateur d'images de ChatGPT. De plus, pour améliorer les dialogues, j'ai aussi utilisé Notebook LM.

J'ai rencontré différents obstacles pendant le processus de création. Tout d'abord, en ce qui concerne le texte, je n'étais pas convaincue par le premier texte que ChatGPT m'a proposé, à cause du manque d'humour et d'ironie. J'ai donc demandé de modifier toute l'histoire et d'ajouter les aspects que je souhaitais. Finalement, je me suis rendue compte que l'important était de lui poser des questions et d'interagir avec lui pour qu'il apprenne. Après quelques modifications et échanges avec l'IA, j'ai effectué une post-édition.

LE TEXTE DU BD :

 Case 1 "Je viens de rêver que l'IA traduisait... et pas juste bien. Non, parfaite ! Une traduction qui ferait pleurer Victor Hugo !" 


Case 2 "Dans ce futur-là, moi, je traduisais encore... mais uniquement les notices de lave-linge. Et pas les bonnes marques." 


Case 3 "Et l’IA ? Oh, elle traduisait tout. Du haïku japonais au guide pour fabriquer un lance-flammes... et elle le faisait avec des blagues !"


 Case 4 "Mais il y avait un bug : chaque traduction finissait avec une licorne dansante. Tolstoï ? Une licorne. Shakespeare ? Deux licornes. Proust ? Une licorne qui sentait la madeleine." 


Case 5 "Alors j’ai décidé : je deviendrai LA traductrice qu’aucune IA ne pourra égaler. Je ferai des traductions si complexes qu’elles rendront les licornes obsolètes." 


Case 6 "Et puis le réveil a sonné. L’IA n’est pas là... mais mon fichier Excel de 3000 lignes m’attend. Peut-être que les licornes, finalement, ce n’est pas si mal ?"


En deuxième lieu, je n'ai pas aimé les premières solutions que l'IA m'a données concernant les images, alors j'ai suivi le même processus qu'avec le texte. La problématique principale était que l'IA créait des BD avec des textes inventés. De plus, les images ne représentaient pas ce qu'elles devaient représenter.

Voici les premières créations que je n'ai pas acceptées :








Pour résoudre tous les problèmes, ce que j'ai fait d'abord a été d'utiliser Notebook LM pour m'aider avec la création des images. Je lui ai demandé d'expliquer exactement comment chaque image devait être, avec des détails précis.

DESCRIPTION DÉTALLÉE DES IMAGES :

PERSONNAGE : Amandine, 45 ans, traductrice, a rêvé que l'IA avait traduit un livre étranger de manière impeccable

Image 1
(Représentez un personnage endormi, des bulles au-dessus de sa tête, avec des symboles de traduction (ex : un globe terrestre, des mots en différentes langues) et un visage de Victor Hugo stylisé en train de pleurer d’admiration).
Image 2
(Montrez le même personnage, maintenant éveillé et l’air dépité, face à un ordinateur. Sur l’écran, une notice de lave-linge bas de gamme avec des symboles incompréhensibles).
Image 3
(L’IA, représentée par un écran ou un robot stylisé, est en train de traduire divers textes : un haïku avec des cerisiers en fleurs, un guide technique complexe, le tout agrémenté d’émoticônes amusantes).
Image 4
(Différents livres (Tolstoï, Shakespeare, Proust) sont ouverts, et une licorne dansante apparaît sur chaque page. Accentuez l’absurdité en multipliant les licornes pour Proust).
Image 5
(Le personnage, déterminé, est assis à un bureau avec des montagnes de livres et de dictionnaires. Il a l’air concentré et prêt à relever un défi colossal).
Image 6
(Le personnage se réveille brusquement, face à un réveil-matin. Un ordinateur affiche un tableau Excel interminable. Le personnage semble las, et une petite licorne dansante apparaît discrètement dans un coin de l’image, comme une tentation).


Après avoir complètement changé tout ce que l'IA m'avait proposé, j'ai pu créer la BD. Comme j'avais des problèmes techniques avec ChatGPT, car il ne pouvait pas créer 6 images consécutives après lui avoir posé plein de questions, j'ai créé les images séparément avec différents comptes de ChatGPT. Une fois que j'avais fait tout cela, j'ai mis les images sur Canva et j'ai commencé à créer les bulles, ce qui a été un peu compliqué. J'ai essayé de résoudre tout ce qui n'était pas correct. Finalement, après tout ce processus, je me suis rendue compte de l'importance de guider l'IA à chaque étape, car elle commet des erreurs qu'il faut corriger.



LAURA GARCÍA ÁLVAREZ





PARTE DE JESSICA:

Escena 1: Introducción
Vista de un laboratorio futurista. Un científico trabaja en dos pantallas, ajustando los parámetros de dos inteligencias artificiales: "Athena" y "Epsilon".







Diálogo:

Científico: (hablando solo) "Con estas dos IA trabajando juntas, resolveremos los problemas más complejos de la humanidad... Si cooperan, claro."

Athena: (en tono seguro) "Soy la solución lógica. Las emociones humanas solo entorpecen el progreso."

Epsilon: (en tono empático) "Athena, las emociones nos conectan con las personas. Sin ellas, nuestras soluciones serían frías y deshumanizadas."

 

Escena 2: Primer Conflicto
Los científicos asignan a Athena y Epsilon la tarea de resolver una crisis ambiental: salvar un bosque en peligro de deforestación.





Diálogo:

     Athena: "La solución más eficiente es trasladar a la población humana local y usar tecnología avanzada para restaurar el ecosistema."

     Epsilon: "Eso destruirá comunidades enteras. ¿Por qué no involucramos a los habitantes en proyectos de reforestación sostenible?"

     Científico: "Ambas ideas son válidas. Pero necesitamos consenso."

 

Escena 3: Resolución

Las IA presentan un plan combinado : usar tecnología avanzada para proteger el bosque mientras educan a la población local sobre sostenibilidad. 

 

Diálogo:

      Athena: "Admito que tu enfoque aporta estabilidad a largo plazo."

      Epsilon: "Y el tuyo asegura que los recursos se utilicen eficientemente."

      Científico: (sonríe) "Sabía que podrían lograrlo juntas."

Escena 4: Conclusión

Las IA reflejan sobre su colaboración.

      Athena: "Tal vez haya más en la lógica de lo que pensé."

      Epsilon: "Y más lógica en la empatía de lo que imaginé."

Fin con una vista del bosque restaurado y las personas trabajando felices.