OpenAI, la société qui a développé Chat GPT, a été fondée en 2015 par plusieurs entrepreneurs parmi lesquels Sam Altman, Jessica Livingston, Reid Hoffman, Ilya Sutskever, Peter Thiel et Elon Musk, ce dernier ayant toutefois quitté l’aventure en 2018 pour éviter de potentiels conflits d’intérêt. L’objectif était initialement de développer des technologies d’intelligence artificielle, en les rendant accessibles à tous, puisque cette organisation avait d’abord été créée en tant qu’association à but non lucratif, pour faire progresser l’intelligence artificielle au profit de l’humanité tout entière, sans que les recherches soient dictées par le besoin d’un retour sur investissement. La société est néanmoins devenue en 2019 une entreprise à « but lucratif plafonné », afin d’attirer les nouveaux investisseurs et bénéficier des fonds nécessaires à son développement dans un environnement concurrentiel.
GPT est l’abréviation de « Generative Pretrained Transformer », soit « transformeur génératif pré-entrainé ». Qu’est-ce à dire ? Chat GPT est entraîné sur un nombre colossal de textes produits par des humains pour prédire quel est le mot susceptible de suivre celui qui précède grâce à une architecture probabiliste extrêmement complexe. Un modèle « transformer » garde en mémoire le contexte général du message et produit ainsi les séquences de mots les plus pertinentes possible. Plus précisément, la phrase de départ est décomposée en une série de symboles. Un poids plus ou moins important est attribué à chaque symbole en fonction de sa place dans la phrase initiale. C’est pour ainsi dire une forme de contextualisation quantifiée du message pour éviter de donner à chaque élément une égale importance.
On passe ensuite à une étape de prédiction des mots qui peuvent suivre, chacun étant affecté d’un coefficient de probabilité qui détermine leur apparition ou leur élimination.
Chat GPT a été originellement entraîné en anglais dans le contexte d’une culture anglo-saxonne. Il peut répondre aujourd’hui dans plusieurs dizaines de langues, selon la probabilité qu’un mot en suive un autre. Philosophiquement, toute la confusion se situe dans la différence entre le vraisemblable et le vrai : l’intelligence artificielle, en ne comprenant pas le langage, présente tous ses résultats sans discernement, d’où son manque de fiabilité potentielle avec ce que les chercheurs appellent des « hallucinations », informations inventées par associations de mots, ce qui peut présenter de graves inconvénients dès lors que la sécurité des personnes est en jeu.
Les contenus initiaux produits par Chat GPT sont humainement triés et améliorés dans certains cas.
Ce post-entraînement est tout à fait fondamental pour maximiser les performances du modèle linguistique. Nommé « Reinforcement Learning from human feedback » (RLHF), il a pour objectif de corriger les résultats obtenus par la machine en lui indiquant ce qui est admissible ou non, en fonction de critères qu’il est important de pouvoir appréhender, notamment au plan éthique.
Avec Chat GPT, on se situe dans le domaine de l’ « IA générative », un secteur en pleine extension. Alors que jusqu’à présent, la majorité des contenus avaient des auteurs humains, on va assister à une croissance exponentielle des contenus créés par les machines, dans tous les types de production : textes, images, vidéos, audio, etc. Pour le meilleur et/ou pour le pire. Quelques problèmes non-exhaustifs à garder en mémoire : le risque de plagiat, le respect de la propriété intellectuelle, la perte de certains emplois et l’émergence corrélative de nouveaux métiers.