L’IA pour générer

Créer sans âme et conscience, mais avec des données ! L’IA générative produit textes, images, sons ou vidéos en apprenant les structures du langage et des formes, sans recul ni compréhension de ce qu’elle génère. Popularisée par des outils comme ChatGPT, l’IA générative transforme notre quotidien, tout en soulevant des enjeux éthiques majeurs : biais, hallucinations, consommation énergétique, droits d’auteur et exploitation des données.

C’est quoi l’IA générative

La grande majorité des modèles d’IA rendus publics et ayant un impact social important sont des modèles d’IA générative.

Bien souvent, l’utilisation du mot “IA” dans le langage populaire désigne cette branche de l’IA spécifique dont le principe est de produire des objets complexes : texte, image, vidéo ou son.

C’est à partir des années 2010 et des avancées en apprentissage profond et aux nouvelles architectures que l’IA générative change de dimension. Une architecture célèbre inventée en 2014, les GANs (Generative Adversarial Network), fonctionne comme un duel.

Un modèle d’IA (le générateur ou le faussaire) essaie de créer une fausse image et un second (le critique) essaie de détecter si l’image est réelle ou générée. À force d'entraînement, le faussaire devient si doué que le critique ne peut plus faire la différence.

Du point de vue technique, les premiers outils génératifs reposent souvent sur une structure d’encodeur-décodeur.

Cette structure se compose de deux réseaux de neurones :

1. Le premier (l'encodeur) convertit une donnée (ex: une phrase) en code informatique abstrait.

2. Le deuxième (le décodeur) convertit ce code en une nouvelle phrase (ou image) selon la demande.

Par exemple, pour traduire, le second réseau décode les concepts abstraits de la phrase anglaise pour les reconstruire en français.

Dans le détail, ces modèles, capables de traiter des informations séquentielles comme des phrases, sont en général basés sur des réseaux de neurones particuliers comme les réseaux récurrents ou des transformers.