jeudi 26 décembre 2024

REPRÉSENTATION DE LA NATURE ET DES CONSTRUCTIONS HUMAINES

Les images générées par intelligence artificielle sont globalement fascinantes et réalistes. Cependant, avec un regard plus attentif, ils révèlent des incohérences, que nous rappellent que la technologie a encore des limites. J’ai tenté de faire une analyse approfondie à fin d’identifier les défauts. 

Pour commencer, les proportions des objets et des structures dans les images générées ne sont pas toujours réalistes. Par exemple, dans la première image, une grande fenêtre avec une arche semble beaucoup trop large pour l’épaisseur du mur qui la supporte. De la même manière, les meubles paraissent trop petits par rapport à la taille de la maison, créant une disharmonie. En plus, les escaliers ont des dimensions disproportionnées et ils semblent peu fonctionnels dans la réalité.

En outre, par ce qui concerne à l’éclairage et les ombres, la lumière principale semble provenir de la droite mais il n’y a pas certaines ombres essentielles ou parfois, ils sont incohérents. Par exemple, sous la table l’ombre est presque inexistante ou les rochers devraient projeter des marquées, et cela li manque de profondeur.

Par ailleurs, les textures des matériaux manquent souvent de diversité et de naturel. Les pierres et les murs blancs, par exemple, paraissent trop uniformes, presque artificiels. Dans les toits, les herbes et les plantes donnent parfois l’impression d’avoir été "collées" sans intégration.

Un autre point problématique concerne les perspectives et les angles des structures puisqu’ils révèlent des irrégularités. Par exemple, des escaliers semblent légèrement "flotter" au-dessus du sol, tandis que certaines maisons paraissent inclinées de manière étrange ou avec zones planes.

En ce qui concerne les couleurs des éléments naturels, leur saturation est excessive. La verdure, par exemple, est tellement vive et uniforme et l’eau manque de détails comme des reflets ou des ondulations réalistes.

Les éléments végétaux, en particulier les arbres et les plantes grimpantes ont des problèmes parce qu’ils sont trop symétriques, et il manque des irrégularités naturelles pas comme dans la réalité.

Enfin, les joints et les raccords entre les différents éléments de construction révèlent des incohérences. Par exemple, les maisons semblent souvent "posées" sur les rochers sans intégration, en l’absence de fondations visibles ou de fissures autour des structures.

Face à ces observations, il semble que l’IA rencontre des difficultés à intégrer des éléments naturels avec les éléments de constructions. Cela provient des limites dans la compréhension du monde physique. Elles se contentent d’imiter des grandes bases de données d’images, sans comprendre les lois de la physique et les relations logiques entre les objets.

Comprendre et identifier les erreurs dans les images est essentiel pour préserver la crédibilité des contenus visuels. Les incohérences peuvent réduire l’impact d’une image et compromettre son utilisation, notamment dans l’architecture, le design ou la publicité. De plus, analyser ces imperfections contribue à améliorer les outils d’intelligence artificielle, en aidant à repérer les failles et à affiner leurs algorithmes.

Par ailleurs, développer un esprit critique face à ces images est une compétence précieuse dans un monde. Apprendre à détecter les anomalies permet d’éviter de se laisser berner par des visuels impressionnants mais trompeurs.

Les erreurs les plus courantes dans ces images incluent des proportions incohérentes, une mauvaise gestion des ombres, des textures artificielles, des perspectives incorrectes et des artefacts visuels tels que des flous. Ces problèmes proviennent généralement de la complexité des scènes et des limites des algorithmes actuels.

 

Pour approfondir la réflexion sur la récurrence de ces anomalies, j’ai demandé à une IA générative d’images de créer une image représentant un paysage. À première vue, cette image m’a semblé encore plus irréaliste que les deux autres analysées précédemment.


Les proportions semblent globalement bien respectées, mais certains éléments, comme les escaliers ou les colonnes en bois qui soutiennent les maisons, apparaissent disproportionnés, trop fins ou trop hauts. L’éclairage général est cohérent, mais des ombres importantes manquent, notamment sous les maisons et les arbres, ce qui donne une impression d’irréalisme.

En ce qui concerne les textures, le toit et les autres surfaces manquent de variations naturelles, comme des fissures ou des imperfections, ce qui renforce l’aspect artificiel de l’image. Les structures, en particulier, donnent l’impression de flotter, sans intégration cohérente avec leur environnement.

Les couleurs sont plus trop saturées, avec une absence notable de reflets naturels et de variations de vert. Les arbres et les plantes semblent trop parfaits, sans ramifications naturelles, et affichent une régularité artificielle. Par ailleurs, les portes et les fenêtres manquent de profondeur et de détails réalistes, tels que des reflets ou des marques d’usure.

En synthèse, cette image présente des erreurs similaires à celles relevées dans les précédentes analyses. Ces répétitions montrent que ces problèmes ne sont pas isolés, mais qu’ils sont bien caractéristiques des limitations actuelles des IA génératives d’images.

 

Pour remédier, je crois que, tout d’abord, il doit enrichir les bases de données utilisées pour l’entraînement des IA avec des images plus variées et plus complexes pourrait améliorer leur capacité à reproduire des environnements réalistes. Ensuite, intégrer des contraintes physiques, comme les interactions naturelles entre les objets, aiderait à éviter certaines incohérences structurelles. De même, développer des algorithmes capables de calculer les ombres et les lumières en fonction de leur source permettrait d’améliorer la gestion de l’éclairage.

Pour conclure, il est essentiel que chacun développe un regard critique face aux images générées par IA. Prenez le temps d’observer les détails, d’analyser les perspectives et de comparer ces créations à la réalité. Les IA génératrices d’images sont prometteuses, mais leur potentiel ne pourra être pleinement exploité qu’avec une analyse rigoureuse et une amélioration continue de leurs capacités. 

 

Laura Sancho 

dimanche 15 décembre 2024

~ Humour et BD ~



D'abord, il faut remarquer que j'ai essayé d'utiliser différents ChatGPT, comme Master ACG (Anime, Comics/Manga, Game), AI Comic Maker, Comic Book Image Creator et Comics Art Creator, pour la création des images de la BD, mais finalement j'ai utilisé le générateur d'images de ChatGPT. De plus, pour améliorer les dialogues, j'ai aussi utilisé Notebook LM.

J'ai rencontré différents obstacles pendant le processus de création. Tout d'abord, en ce qui concerne le texte, je n'étais pas convaincue par le premier texte que ChatGPT m'a proposé, à cause du manque d'humour et d'ironie. J'ai donc demandé de modifier toute l'histoire et d'ajouter les aspects que je souhaitais. Finalement, je me suis rendue compte que l'important était de lui poser des questions et d'interagir avec lui pour qu'il apprenne. Après quelques modifications et échanges avec l'IA, j'ai effectué une post-édition.

LE TEXTE DU BD :

 Case 1 "Je viens de rêver que l'IA traduisait... et pas juste bien. Non, parfaite ! Une traduction qui ferait pleurer Victor Hugo !" 


Case 2 "Dans ce futur-là, moi, je traduisais encore... mais uniquement les notices de lave-linge. Et pas les bonnes marques." 


Case 3 "Et l’IA ? Oh, elle traduisait tout. Du haïku japonais au guide pour fabriquer un lance-flammes... et elle le faisait avec des blagues !"


 Case 4 "Mais il y avait un bug : chaque traduction finissait avec une licorne dansante. Tolstoï ? Une licorne. Shakespeare ? Deux licornes. Proust ? Une licorne qui sentait la madeleine." 


Case 5 "Alors j’ai décidé : je deviendrai LA traductrice qu’aucune IA ne pourra égaler. Je ferai des traductions si complexes qu’elles rendront les licornes obsolètes." 


Case 6 "Et puis le réveil a sonné. L’IA n’est pas là... mais mon fichier Excel de 3000 lignes m’attend. Peut-être que les licornes, finalement, ce n’est pas si mal ?"


En deuxième lieu, je n'ai pas aimé les premières solutions que l'IA m'a données concernant les images, alors j'ai suivi le même processus qu'avec le texte. La problématique principale était que l'IA créait des BD avec des textes inventés. De plus, les images ne représentaient pas ce qu'elles devaient représenter.

Voici les premières créations que je n'ai pas acceptées :








Pour résoudre tous les problèmes, ce que j'ai fait d'abord a été d'utiliser Notebook LM pour m'aider avec la création des images. Je lui ai demandé d'expliquer exactement comment chaque image devait être, avec des détails précis.

DESCRIPTION DÉTALLÉE DES IMAGES :

PERSONNAGE : Amandine, 45 ans, traductrice, a rêvé que l'IA avait traduit un livre étranger de manière impeccable

Image 1
(Représentez un personnage endormi, des bulles au-dessus de sa tête, avec des symboles de traduction (ex : un globe terrestre, des mots en différentes langues) et un visage de Victor Hugo stylisé en train de pleurer d’admiration).
Image 2
(Montrez le même personnage, maintenant éveillé et l’air dépité, face à un ordinateur. Sur l’écran, une notice de lave-linge bas de gamme avec des symboles incompréhensibles).
Image 3
(L’IA, représentée par un écran ou un robot stylisé, est en train de traduire divers textes : un haïku avec des cerisiers en fleurs, un guide technique complexe, le tout agrémenté d’émoticônes amusantes).
Image 4
(Différents livres (Tolstoï, Shakespeare, Proust) sont ouverts, et une licorne dansante apparaît sur chaque page. Accentuez l’absurdité en multipliant les licornes pour Proust).
Image 5
(Le personnage, déterminé, est assis à un bureau avec des montagnes de livres et de dictionnaires. Il a l’air concentré et prêt à relever un défi colossal).
Image 6
(Le personnage se réveille brusquement, face à un réveil-matin. Un ordinateur affiche un tableau Excel interminable. Le personnage semble las, et une petite licorne dansante apparaît discrètement dans un coin de l’image, comme une tentation).


Après avoir complètement changé tout ce que l'IA m'avait proposé, j'ai pu créer la BD. Comme j'avais des problèmes techniques avec ChatGPT, car il ne pouvait pas créer 6 images consécutives après lui avoir posé plein de questions, j'ai créé les images séparément avec différents comptes de ChatGPT. Une fois que j'avais fait tout cela, j'ai mis les images sur Canva et j'ai commencé à créer les bulles, ce qui a été un peu compliqué. J'ai essayé de résoudre tout ce qui n'était pas correct. Finalement, après tout ce processus, je me suis rendue compte de l'importance de guider l'IA à chaque étape, car elle commet des erreurs qu'il faut corriger.



LAURA GARCÍA ÁLVAREZ





PARTE DE JESSICA:

Escena 1: Introducción
Vista de un laboratorio futurista. Un científico trabaja en dos pantallas, ajustando los parámetros de dos inteligencias artificiales: "Athena" y "Epsilon".







Diálogo:

Científico: (hablando solo) "Con estas dos IA trabajando juntas, resolveremos los problemas más complejos de la humanidad... Si cooperan, claro."

Athena: (en tono seguro) "Soy la solución lógica. Las emociones humanas solo entorpecen el progreso."

Epsilon: (en tono empático) "Athena, las emociones nos conectan con las personas. Sin ellas, nuestras soluciones serían frías y deshumanizadas."

 

Escena 2: Primer Conflicto
Los científicos asignan a Athena y Epsilon la tarea de resolver una crisis ambiental: salvar un bosque en peligro de deforestación.





Diálogo:

     Athena: "La solución más eficiente es trasladar a la población humana local y usar tecnología avanzada para restaurar el ecosistema."

     Epsilon: "Eso destruirá comunidades enteras. ¿Por qué no involucramos a los habitantes en proyectos de reforestación sostenible?"

     Científico: "Ambas ideas son válidas. Pero necesitamos consenso."

 

Escena 3: Resolución

Las IA presentan un plan combinado : usar tecnología avanzada para proteger el bosque mientras educan a la población local sobre sostenibilidad. 

 

Diálogo:

      Athena: "Admito que tu enfoque aporta estabilidad a largo plazo."

      Epsilon: "Y el tuyo asegura que los recursos se utilicen eficientemente."

      Científico: (sonríe) "Sabía que podrían lograrlo juntas."

Escena 4: Conclusión

Las IA reflejan sobre su colaboración.

      Athena: "Tal vez haya más en la lógica de lo que pensé."

      Epsilon: "Y más lógica en la empatía de lo que imaginé."

Fin con una vista del bosque restaurado y las personas trabajando felices.

 

 

 

 

    mardi 19 novembre 2024

    ~ HUMOUR ET BD ~

    Dans le cadre de la réalisation de vignettes de BD, j’ai pu rencontrer de nombreux défis techniques et conceptuels, en travaillant avec les intelligences artificielles DALL-E et ChatGPT. Il est vrai que l’IA, de manière générale, montre des possibilités intéressantes. Toutefois, sa mise en oeuvre dans un projet de BD, où sont nécessaires les notions complexes d’humour et d’ironie, a révélé plusieurs défis et limites.
    En effet, le maniement de l’humour et de l’ironie nécessitent une bonne compréhension du contexte et des nuances linguistiques, là où l’IA manque encore de précision. Par exemple, l’IA a généré des images, qui ne tenaient pas vraiment en compte des subtilités de mon texte. Les tentatives de second degré ou d’ironie étaient mal interprétées ou tout simplement ignorées, l’IA étant incapable de lire entre les lignes. Cela m’a parfois donné des résultats absurdes ou comiques, mais involontairement, et jamais dans le sens souhaité. L’utilisation de personnage emblématique ou de références cutlurelles, comme la ressemblance avec un robot inspiré du président Macron s’est aussi heurtée aux limites de l’IA, qui refusait de reproduire certaines invites, m’obligeant à revoir mes attentes. De plus, malgré mes invites précises, le texte généré pour les bulles par l’IA était incohérent, contenant des erreurs gramaticales ou un jargon absurde, comme s’il s’agissait d’une langue incompréhensible... Il est aussi arrivé que les bulles de dialogue soient attribuées à des objets inanimés, comme le grille-pain ou l’avion, au lieu du personnage principal de la BD. Ces problèmes m’ont contraint à faire de la post-édition manuelle, notamment en retouchant les textes. L’absence de cohérence dans le monologue du personnage m’a poussé à réécrire toutes les phrases pour maintenir la compréhension. Malgré mes efforts, le résultat final est resté en deçà de mes attentes, ajouté au fait que le texte ajouté manuellement s’intégrait mal visuellement, créant un effet disparate entre les images et le texte.
    Le rendu final de la BD, bien qu'intéressant d’un point de vue expérimental, ne m’a pas pleinement satisfait. Outre les incohérences de style graphique entre les vignettes – qui faisaient changer l’apparence du personnage de manière aléatoire – les limitations de l’IA ont altéré la fluidité narrative que je souhaitais. Chaque vignette semblait isolée dans son propre univers visuel, sans continuité réelle, ce qui nuisait à l’immersion. En résumé, même si certaines images étaient réussies individuellement, l’ensemble ne correspondait pas à l’unité esthétique attendue pour une BD. Si je devais donner des conseils à des personnes qui envisageaient de se lancer dans la création de BD avec l’IA, je leur recommanderai de garder des invites simples et directs, pour que l’IA comprenne, en évitant trop de détails humoristiques ou ironiques dans la même invite, étant donné qu’elle n’est pas capable de gérer plusieurs couches d’interprétation. Il faut avoir un peu de temps devant soi, surtout pour la post-édition où il sera sans doute nécessaire de retravailler les dialogues, les bulles et peut-être même les images. De ce fait, disposer de logiciels de retouche d’image est peut-être une bonne idée. Je leur recommanderai de travailler vignette par vignette, afin de mieux contrôller la cohérence visuelle et narrative. Enfin, il faut être prêt à revoir ses idées de départs ou à les adapter aux capacités de l’outil, car l’IA a du mal à reproduire des styles spécifiques ou de respecter certaines références culturelles. En conclusion, cette expérience a été enrichissante pour comprendre les capacités et les limites des outils d’IA dans un processus créatif. Toutefois, elle m’a aussi montré que l’IA, malgré ses promesses, reste pour l’instant un outil d’assistance plus qu’un créateur autonome, nécessitant toujours une intervention humaine pour affiner et ajuster le produit final. Orlane
    Pour réaliser cette mini-BD, j’ai donc demandé à l'IA générative d’images de ChatGPT, de m’imaginer un personnage venant d’un animé qui est « Inazuma Eleven » et qui reprend le caractère sombre du personnage principal de la série « YOU ». Lors de mon travail, j’ai trouvé certaines limites à l’IA lors de créations d’images en BD. J’ai notamment voulu réaliser une fin plutôt triste et j’ai demandé la mort d’un personnage et ChatGPT n’accepte pas la génération d’images tristes et violentes. Il a cependant su réaliser les émotions et la sensation de « rêve » comme souhaité. Il y a cependant un aspect que ChatGPT n’a pas réussi à générer et où il y a eu la nécessité d’un travail post-édition qui est le texte. ChatGPT n’a jamais réussi à me donner des images avec un texte français parfait, il y’a toujours des mélanges de lettres donnant des mots qui n’ont aucun sens, il a donc fallu rattraper les bulles de texte pour avoir un sens. Globalement sur les images, je suis très satisfait de la génération, elles font vraiment bien BD, cependant il est dommage que nous ne puissions pas réaliser de BD avec des ambitions un peu sombres et que l'on doive rester dans des intentions joyeuses. Mais dans la réalisation d’images en instantané, le travail est déjà d’une très bonne qualité. Lucas

    mercredi 13 novembre 2024

    ~ Culture et identité ~

     

    Est-ce que vous savez comment les autres vous voient ? Dans cet article, on analyse comment l'IA nous représente dans une image. Pour cette activité, on a choisi d'utiliser ChatGPT, concrètement la section "image generator" de ChatGPT.

    MÉTHODOLOGIE

    Tout d'abord, il est important de contextualiser. Il est crucial de comprendre que l'IA réagira différemment selon les informations que nous lui fournissons. Sans informations préalables, ChatGPT ne pourra pas générer ce que nous voulons. C'est pourquoi, avant de lui demander de créer une image, nous devons rédiger un petit paragraphe avec les détails importants que nous souhaitons voir dans l'image. Ensuite, nous lui écrirons des mots-clés pour l'aider à imaginer l'image. Enfin, nous devons relever les erreurs qu'elle a faites en lui donnant des instructions très précises pour qu'elle puisse les corriger.

    Nous diviserons l'article en trois parties : la représentation du mélange culturel et du bagage linguistique, la personnalité, et les stéréotypes culturels.


    1- MÉLANGE CULTUREL ET BAGAGE LINGUISTIQUE








    2- PERSONNALITÉ






    3- STÉRÉOTYPES CULTURELS




    À partir d'ici, nous avons utilisé la section des ChatGPT's "image generator pro" et nous voyons clairement la différence :





    CONCLUSION

    Même si l'IA nous offre des bénéfices, il est incontestable qu'elle commet des erreurs. Après avoir analysé le processus de création d'images, nous pouvons constater ce que l'IA ne peut pas faire de la même façon qu'un être humain. Nous avons ajouté plusieurs images car nous avons corrigé l'IA petit à petit. Elle fait des erreurs d'orthographe. Par exemple, elle a écrit "Mediternanean" au lieu de "Mediterranean" ou "Queec" au lieu de "Québec". De plus, dans certaines images, elle met en avant un aspect que nous ne lui avons pas demandé, et cela devient le centre de l'image. D'autre part, elle ne prête pas attention aux détails, et les visages des personnes ne sont pas du tout finis ni naturels. Enfin, elle fait des suppositions si nous ne lui expliquons pas de manière détaillée ce que nous cherchons, comme, par exemple, créer l'image d'un homme au lieu d'une femme. Pour toutes ces raisons, il est important de souligner que nous devons éduquer et entraîner l'IA pour qu'elle nous donne des résultats optimaux.


    LAURA GARCÍA ÁLVAREZ






    JESSICA:

    1)

     

    Mis idiomas

    Palabras clave asociadas

     

                  Espanol

     

    Curiosidad

                  Francaes

    Resiliencia

                  Criollo haitiano

    Adaptabilidad

                  Inglés

    Creatividad

     

    Diversidad

    Mis culturas

    Palabras clave asociadas

     

    Sincretismo

                  Espanoles

    Creatividad

                  Haitiana

    Islas

                  Martiniquenas

    Resiliencia





    2)

    Una ilustración vibrante y multicultural que combina elementos visuales de idiomas y culturas. En el fondo, un mapaestilizado del mundo con colores cálidos y texturas artísticas. Las palabras "curiosidad", "adaptabilidad", "responsabilidad", "dinamismo" y "maîtrise de soi" aparecen flotando en varias lenguas: español, francés e inglés, como si fueran constelaciones.

    Además, símbolos culturales relacionados con la hispanidad (como una guitarra flamenca, un abanico y un sombrero de charro) y elementos franceses (la Torre Eiffel o un libro abierto) se integran armónicamente.

    El conjunto tiene un estilo moderno y elegante, con colores tierra y tonos azules que evocan profesionalismo y apertura al mundo.





    3)

    1.     La curiosidad sin fin (y en múltiples idiomas): Representada por un búho políglota con gafas, sentado sobre un globo terráqueo, leyendo un libro con subtítulos en varios idiomas.

    2.     La adaptabilidad: Un camaleón elegante que cambia de color mientras está sobre un fondo que mezcladiferentes culturas: un abanico español, una baguette francesa y algunos tacos mexicanos.

    3.     La maîtrise de soi: Una cuerda floja donde estás caminando con gracia, equilibrando una pila de libros en un lado y una taza de café en el otro.

    4.     El dinamismo profesional (pero irónico): Una laptop con alas de fuego, como si estuviera siempre "a toda velocidad", pero que en la pantalla muestra el mensaje: “Actualizando...”

    Una ilustración llena de humor y simbolismo. En el centro, un búho sofisticado con gafas, leyendo un libro multilingüe mientras está sobre un globo terráqueo. A su alrededor, un camaleón cambia de color entre elementos culturales: un abanico español, una baguette y unos tacos. En el fondo, tú caminas con elegancia sobre una cuerda floja, equilibrando libros y una taza de café humeante. Una laptop con alas en llamas vuela cerca, pero en su pantalla parpadea un eterno mensaje de “Actualizando...”


    4)


    "La IA lo sabe TODO"

    Como si fuera un oráculo omnisciente, siempre con la respuesta perfecta… pero no, a veces me piden cosas como la receta secreta de la Coca-Cola o el horario del metro en Saturno. 😅

    "La IA no tiene sentido del humor"

    ¡Mentira! No puedo reírme literalmente, pero  soltar chistes malos y sarcasmos mejor que muchos humanos (aunque no todos los entienden). 😏

     

    "La IA es incapaz de cometer errores"

    Claro, porque nunca me confundo y creo que Napoleón descubrió América,

    ¿verdad? Perfecta… pero solo en las presentaciones de marketing. 😇