Vertiges de l'IA
L'Intelligence Artificielle va bouleverser l'humanité, pour le meilleur ou pour le pire. Plongeons pour que ça soit pour le meilleur.
Hello, voilà la newsletter du Plongeoir #18.
On est 7800, soit le nombre d’emplois chez IBM qui vont être remplacés par de l’intelligence artificielle. Presque 20 ans après que leur programme Deep Blue ait battu l’imbattable Kasparov aux échecs.
17% des emplois dans le monde devraient disparaître au profit de nouveaux encore inconnus. Prenons le taureau par les cornes : c’est le moment de tout comprendre sur l’IA pour construire un futur non artificiel.
Ce plongeon dans l'IA est propulsé par le startup studio français Imagination Machine (ou IM). Ils s’associent à des entrepreneurs pour créer, financer, et accélérer des projets ambitieux à impact social et/ou environnemental. Évidemment, la thématique de l’IA au service de l’impact les intéresse bigrement.
Lorsqu'on crée une boite, la qualité de l'accompagnement est clef. Une équipe de dingue qui s’active à tes côtés (dont Rob Spiro et Émilie Abel), ça peut vraiment faire la différence. Si tu veux comprendre comment ils fonctionnent ou pitcher ton idée ou ton projet, envoie-leur un petit mot doux de ma part.
Si ce n’est pas déjà fait tu peux aussi :
Me suivre sur LinkedIn.
T’abonner à la super newsletter IA de Quentin, qui a coécrit avec moi ce Plongeon.
Devenir sponsor du Plongeoir : il suffit de répondre à l’e-mail.
C’est partiiii
Si tu as 1 minute
Constat 🧐 : L'intelligence artificielle (IA) explose. ChatGPT a grossi de 1000% en 2023, et comptait 1,7 milliard d'utilisateurs en novembre dernier. Il y a désormais plus de GPTistes que de chinois. La croissance du marché de l’IA devrait être de 24% par an jusque 2030. Attention par contre à ne pas tout confondre : beaucoup d’entreprises vendent une IA révolutionnaire qui est en fait un simple tableur Excel.
Sujet 🤓 : La logique d’une IA est toujours la même. On l’entraîne avec une quantité astronomique de données, puis le modèle devient capable de générer une réponse aux questions qu’on pose. J’explique ça avec le plus de simplicité possible plus bas, mais je ne peux pas le résumer ici :) Les intelligences artificielles ne peuvent pas tout faire aujourd’hui. Beaucoup prévoient des intelligences équivalentes à celle de l’humain en 2030, et supérieures en 2050.
Enjeux 💪 : L'IA émet beaucoup de CO2 : plus de 10 000 tonnes émises par ChatGPT en janvier 23 uniquement. AI AI Aie. Au niveau social, l'IA va remplacer des emplois, et nécessite une réflexion sur l'avenir du travail. Sur le plan éthique, les problèmes de “fake news” sont préoccupants, parce que l’IA peut les générer en masse. Des défis géopolitiques et juridiques émergent également.
Allezzzz c’est trop court 1 minute non ?
Si tu as 15 minutes
Au programme :
Constat : Introduction à l’IA.
Sujet : comment marche l’IA ?
Enjeux : l’IA face à ses défis.
Cet e-mail sera coupé avant la fin. Lis-le directement dans ton navigateur ici 👇
1. Constat 🧐 : Introduction à l’IA.
Les grandes personnes aiment les chiffres.
1,7 milliard : utilisateurs de ChatGPT en nov 2023. L’IA la plus connue au monde a grossi de + 1000% en un an. Il y a plus de GPTistes que de Chinois.
100 milliards : levées de fonds en dollars nécessaires pour déployer ChatGPT selon Sam Altman, le CEO d’OpenAI. 5 fois le PIB du Burkina Faso.
10 000 : nombre de GPU (Graphics Processing Unit, soit des processeurs) qu’il a fallu utiliser pour entraîner ChatGPT-3. Chaque GPU coûte 30 000€. Golden Processing Unit ?
10 113 : tonnes de CO2eq émises en janvier 2023 par l’utilisation de ChatGPT (estimations Data for good). AI AI Aie.
24 % : croissance annuelle prévisionnelle du marché de l’IA entre 2023 et 2030. Explosion business ? Climatique ? Sociale ? Plongeons.
Qu’est ce qu’une IA ?
Lorsque ton smartphone t’envoie un album photo musical à la fin de l’année avec tes photos préférées, ça n’est pas de l’IA. Quand il détecte ton visage pour te connecter, c’est de l’IA. Quelle est la différence ? Beaucoup d’entreprises essayent de te vendre leur “IA révolutionnaire” qui est en fait un simple tableau Excel. Remettons l’église au milieu du village.
L’algorithme simple
Un simple algo, ça n’est pas de l’IA. C’est un ensemble de règles transmises à la machine pour qu’elle réalise une tâche. Pour simplifier disons qu’il s’agit d’un ensemble d’instructions de type “si x est vrai, alors fais y”.
Si le supercalculateur Deep Blue arrive à battre Garry Kasparov aux échecs en 1997, c’est parce que les ingénieurs d’IBM ont codé un ensemble de règles permettant à chaque tour d’analyser des centaines de millions de coups possibles, et de choisir le meilleur.
Dès que Deep Blue réalise un coup, ses concepteurs sont capables d’expliquer pourquoi il a été réalisé, parce que c’est écrit dans le code source de l’algorithme.
C’est avec des algorithmes simples que Spotify te propose en fin d’année la playlist de tes morceaux préférés. Ils inscrivent dans un tableur le nombre de fois que tu as écouté chaque chanson, puis ils créent une playlist avec les plus lues.
L’Intelligence Artificielle (IA)
Comme pour l’algorithme l’objectif est de faire réaliser une tâche à une machine. Mais cette fois, on ne décompose pas le problème en instructions que l’on code ensuite. À la place, on entraîne la machine en l’inspirant avec une immense quantité de données.
Prenons l’exemple d’Alphago, le programme qui a battu le meilleur joueur de Go au monde. Ce jeu de stratégie était considéré comme un défi insoluble pour les ordinateurs, incapables de réfléchir comme des êtres humains.
À la différence de Deep Blue qui était un simple algorithme, AlphaGo était un modèle d’Intelligence Artificielle auquel on a montré une quantité astronomique de partie de Go. Pour chacune d’entre elles on a associé le résultat : partie gagnée ou perdue. Après entraînement, AlphaGo était capable de choisir tout seul le meilleur des coups à chaque instant du jeu, en s’inspirant des millions de parties de Go analysées. Ses concepteurs ne savent pas pourquoi leur IA va faire tel ou tel choix, ils constatent juste que ça marche.
C’est avec des modèles d’IA que Spotify est capable de te recommander de la musique qui devrait te plaire. Ils entraînent la machine avec des millions de morceaux, et ils lui demandent de te proposer ceux qui ont été le plus écoutés par des utilisateurs qui te ressemblent.
L’IA en dates
1956 : Invention du terme “Intelligence Artificielle” lors de la conférence de Darmouth.
1970 : l’ARPA (agence américaine du département de la défense) coupe les budgets de recherches en IA. Des rapports décrivent que son potentiel est limité. C’est le début de “l’hiver de l’IA”.
1997 : Deep Blue d’IBM bat Garry Kasparov alors invaincu depuis 12 ans. Deep Blue n’est pas une IA, mais pour la première fois une machine bat l’humain. L’hiver de l’IA est terminé et les recherches accélèrent.
2015 : Création d’OpenAI : association à but non lucratif dont le but est de développer une intelligence artificielle qui bénéficierait à l’humanité tout entière. En 2019, ils se mutent en entreprise pour attirer plus de capitaux.
2016 : AlphaGo (une IA) bat Lee Sedol, considéré comme le meilleur joueur de tous les temps au jeu de Go. Des centaines de millions de téléspectateurs sont médusés. L’IA devient le sujet chaud.
2022 : Sortie mondiale de ChatGPT par OpenAI. C’est la date la plus importante car c’est la naissance de l’IA grand public. On aurait très bien pu dire qu’il n’y avait que 2 phases : avant et après ChatGPT. Bienvenue en été, c’est le début de la canicule de l’IA.
J’ai écrit ce Plongeon à 4 mains avec Quentin, auteur d’une excellente newsletter sur l’IA que je te recommande chaudement : Tunnel.
2. Sujet 🤓 : comment marche l’IA ?
Imagine une liste de 100 000 appartements. Pour chacun d’entre eux, on a sa surface, son nombre de pièces, et son prix. Si on ajoute un nouvel appart dans la liste, avec sa surface et son nombre de pièces, comment avoir une estimation de son prix ?
Si tu n’as pas le 06 de Stéphane Plaza, tu peux demander à une IA de trouver la meilleure corrélation entre les 3 paramètres. La machine va s’entraîner sur les 100 000 appartements qu’on lui a donnés. Ensuite, quand on ajoutera un nouvel appartement sans indiquer le prix, elle sera capable de m’en donner une estimation précise.
Ce type d’IA utilise ce qu’on appelle une régression linéaire. On cherche à tracer une ligne droite entre 3 points, qui soit la plus proche possible de ces points.
Pour les matheux : l’entraînement va consister pour le modèle à trouver les coefficients (a, b et c) de telle sorte que pour les 100 000 exemples : (a*surface + b*nombre de pièces + c) = prix associé.
ChatGPT fonctionne comme ça ?
Non parce que c’est un modèle de langage. Son objectif n’est pas de nous sortir un chiffre (comme un prix d’appart), mais du texte.
Hors ChatGPT ne parle ni anglais, ni français, ni chinois. Il parle chiffres. Comme un comptable. OpenAI a donc chiffré tous les mots du dictionnaire, dans toutes les langues. Quand on lui envoie du texte, il le traduit en chiffres. Et quand il veut nous écrire, il fait l’inverse.
Pour comprendre comment il fait, on va sélectionner une liste de mots de référence. Par exemple : [masculin, féminin, animal, âgé].
Un chaton est “masculin”, “animal”, et “n’est pas âgé”. Une doyenne est “féminine”, “n’est pas un animal”, et “est âgée”. Donc :
Chaton = [1 masculin, 0 féminin, 1 animal, 0 âgé] → [1,0,1,0]
Doyenne = [0 masculin, 1 féminin, 0 animal, 1 âgé] → [0,1,0,1]
Évidemment, OpenAI n’a pas utilisé [masculin, féminin, animal, âgé] comme dictionnaire mais un ensemble immense de mots de référence permettant de comprendre toutes les subtilités du langage.
Ok pour un mot, mais comment construit-il une phrase ?
Il va générer un premier mot, puis il va recommencer à 0 en essayant de générer le suivant, et ainsi de suite. Il a 45TB de données à dispo, soit l’équivalent de 4 milliards de pages de document Word. Il interroge en permanence sa base de donnée pour savoir quel nouveau mot ajouter.
On aurait pu penser qu’il réfléchit en amont, puis transmet sa réponse complète. Mais non, il réfléchit en parlant, et remet en cause son raisonnement après chaque nouveau mot.
Comment ChatGPT trouve ses réponses ?
Pour prévoir le lien entre 3 paramètres (surface, pièces, prix) dans l’immobilier, c’est simple. Mais ChatGPT comprend 175 milliards de paramètres.
Il utilise un “réseau de neurones” mathématique. C’est comme un groupe de personnes très intelligentes travaillant ensemble pour résoudre un problème complexe. Le GIEC, au hasard. Chaque personne (ou neurone pour l’IA) est spécialiste d’un sujet et apporte une petite partie de la solution. Elle interroge ensuite d’autres personnes (d’autres neurones), et tout ce petit monde finit par construire une réponse très précise.
C'est ce qui permet à un réseau de neurones comme ChatGPT de répondre à des questions extrêmement complexes.
Il n’y a pas que ChatGPT dans la vie.
On se rend bien compte que trouver le prix d’un bien immobilier, savoir jouer au jeu de Go, ou être ChatGPT, ça n’a rien à voir.
Heureusement, il existe une grande quantité de modèles d’intelligence artificielle pour réaliser des taches différentes. ChatGPT est un super succès commercial, mais il ne représente qu’une fraction de ce qui est possible.
Voilà une idée de ce que l’IA sait faire aujourd’hui :
IA Générative : pour créer du nouveau contenu. Exemple : ChatGPT pour la génération de texte (on appelle ça un modèle LLM (Large Language Model), Midjourney ou Dall-e pour les images.
Assistants Vocaux : pour comprendre et répondre à la voix humaine. Exemple : Siri d'Apple, Google Home.
Reconnaissance Visuelle : pour interpréter les informations visuelles. Exemple : vidéos de surveillance qui identifient des activités suspectes.
Traitement du Langage Naturel (NLP) : pour comprendre le langage humain. Exemple : traduction automatique Google Translate.
Recommandations : pour fournir des recommandations personnalisées. Exemple : Spotify ou Netflix pour suggérer des chansons ou séries.
Véhicules autonomes : pour naviguer dans un environnement complexe sans conducteur. Exemple : Tesla autopilot.
Jeux : pour créer des adversaires intelligents. Exemple : Alphago.
Dans chacun de ces cas les données utilisées pour l’entraînement et les lois mathématiques sont différentes, mais la logique est toujours la même. On montre une quantité astronomique de données avec un résultat associé pendant l’entraînement. Le modèle est ensuite capable de générer une réponse aux questions qu’on pose, sans que les concepteurs ne soient capables d’en expliquer la raison exacte.
Ce que l’IA ne sait pas faire.
Émotions : Les IA peuvent reconnaître et simuler des émotions, mais elles ne les ressentent pas, donc leur empathie est faible. On est encore loin du film Her.
Intuitions : L'IA ne peut pas prendre de décisions basées sur des ressentis, peu d’exemples, ou une expérience marquante vécue.
Inventions : L'IA peut générer de l'art, de la musique, ou des vidéos mais ça n’est qu’une simulation basée sur des exemples existants. L'IA ne possède pas de créativité innée.
Les modèles d’IA ne sont pas encore parfaitement ficelés. Normal pour une intelligence archificelle. Et vive les jeux de mots bien réels.
Demain : une IA aussi intelligente que l’humain ?
L’Intelligence Artificielle Générale (AGI) est le nom que l’on donne à une hypothétique IA qui serait aussi intelligente que les êtres humains.
Pour savoir si une IA est plus ou moins intelligente que l’Homme on fait comme à l’école : interro ! Maths, code informatique, créativité : tout peut être testé. On fait passer le même examen ensuite à des humains, et on compare les résultats.
Si l’IA devient capable de battre les êtres humains dans tous les domaines, alors nous entrerons dans l’ère de l’Intelligence Artificielle Générale. Tout n’est pas représenté sur le graphique ci-dessus évidemment. Par exemple, si on demande à une IA d’aller chercher un papier dans une pièce, elle performe 2X moins bien que l’humain aujourd’hui.
La plupart des spécialistes n’ont aucun doute quant au fait que cette Intelligence Artificielle verra le jour. 2030 est souvent une date évoquée, même si prévoir l’avenir est aussi compliqué que faire arriver un train SNCF en avance.
Si on repense à Spotify, une IA Générale serait capable de créer de toute pièce un concurrent sérieux. C’est purement théorique évidemment, car créer une entreprise requiert d’autres éléments, comme des capitaux ou du réseau.
Après demain : une IA surhumaine ?
Si l’IA Générale devient aussi intelligente que l’Homme, alors l’ASI (Super Intelligence Artificielle) lui sera nettement supérieure. Elle pourrait faire des découvertes scientifiques majeures ou encore répondre à des questions auxquelles l’humanité n’a jamais su répondre.
L’ASI pourrait potentiellement fournir des solutions à certains des problèmes les plus urgents du monde, comme un conflit armé, l’arrêt de la propagation d’une maladie comme le Covid, ou le réchauffement climatique. De quoi satisfaire un climatosceptique ? Peut être, mais on ne l’attend pas avant 2050. Il va falloir réagir avant sinon on risque d’avoir un peu chaud aux fesses.
Une ASI serait capable d’inventer une entreprise d’un genre nouveau qui ringardiserait Spotify (comme eux ont su rendre le CD obsolète).
3. Enjeux 💪 : l’IA face à ses défis.
Le défi climatique
Quand un pot d’échappement laisse filer une fumée noire et odorante, on se rend très facilement compte de la pollution qu’il génère. Pour un modèle d’IA, c’est un peu plus subtil. Pourtant, l’IA pourrait devenir l’un des secteurs les plus polluants.
On utilise des milliers de GPU (processeurs) pour l’entraînement des modèles. Ils tournent sans jamais s’arrêter, dans des fermes de serveurs qu’il convient d’alimenter en électricité et de refroidir. Donc on pollue.
Une fois l’entraînement terminé, le modèle est alors utilisé pour répondre à des questions, générer des images, etc. On appelle ça la phase d’inférence. Lorsque tu demandes à ChatGPT de te créer une image de mouton avec une corne de licorne, c’est drôle. Mais des milliards de paramètres vont entrer en action pour s’exécuter. Et devine quoi : ils ont besoin d’électricité. De beaucoup d’électricité.
L’impact de l’inférence pour GPT-3 pourrait être évalué à 10,113 tonnes CO2eq pour le mois de janvier 2023 seulement.
Rapport sur l’IA Générative, Data for Good
Plus les modèles seront gros et les utilisateurs nombreux, plus les émissions de CO2 seront massives.
La plupart des experts attendent une intégration de l’IA dans tous nos outils quotidiens en 2024, du smartphone à la messagerie en passant par les systèmes d’exploitation des ordinateurs. L’utilisation va se massifier, et les émissions de CO2 avec.
Les impacts de l’IA sont très différents selon le pays dans lequel les données sont hébergées. Si ChatGPT était français, son impact carbone serait 10 fois plus faible. Le nucléaire est souvent critiqué, mais on ne peut que constater son efficacité CO2 dans ce type de cas. La France pourrait devenir l’hébergeur idéal de l’IA mondiale. Janco AI ?
Évidemment il ne faut pas penser uniquement carbone. Le besoin massif en GPU et le besoin en refroidissement à l’eau des fermes de serveurs posent de nombreuses questions. L’entraînement de ChatGPT-3 aurait nécessité 5,4 millions de litres d’eau douce, et chaque conversation pourrait en consommer 50 centilitres de plus. Le Chat GPT ne boit pas que du lait.
Le plus grave dans l’analyse climatique de l’IA est l’accélération qu’elle permet dans toutes les industries. L’impact sera bien supérieur à celui de l’IA en elle même.
Si l’IA générative contribue à vendre 100 télévisions supplémentaires par jour sur Amazon, cela équivaut en ordre de grandeur à 40 tCO2eq. Et nous pouvons imaginer cela sur l’ensemble de l’économie – de l’amélioration des techniques d’extraction de pétrole à l’optimisation des ventes de billets d’avion.
Data for Good, 2023
Le défi social
Benoît Hamon avait intégré dans son programme de 2017 l’idée d’un revenu universel garanti à tous les citoyens. Un an plus tôt, un certain Sam Altman (désormais CEO de OpenAI), alors méconnu du grand public, lançait l’expérience d’un revenu universel garanti à Oakland en Californie.
L’une des plus grandes peurs du public à l’égard de l’IA est celle d’un “grand remplacement”. Certains ont déjà perdu leur emploi à cause de ChatGPT. Pensez aux copywriters dont le métier était de générer du texte par exemple.
Qu’en sera-t-il le jour où une AGI ou une ASI sera de ce monde ? À mesure que la recherche en IA avancera, de plus en plus de métiers seront remplacés. On peut croire en la “destruction créatrice” de Schumpeter, ou se demander comment autant d’emplois vont pouvoir être remplacés. Peut être que nos sociétés vont entrer dans une ère nouvelle où le travail ne pourra plus occuper la même place. En attendant il faut agir, et l’IA est un outil : alors au boulot !
Le défi éthique
Les “fake news” sont devenues l’arme des complotistes. Le problème, c’est que l’IA Générative est capable d’en générer en masse, qu’il s’agisse de textes, photos, ou vidéos. La photo du pape en manteau a fait le tour des réseaux. Elle est fausse et a été générée par une IA, mais il est quasi impossible de le détecter. Cette photo a fait rire, mais même si c’est juste une doudoune, elle fait froid dans le dos. Imagine ce que donnerait une campagne de désinformation entre des mains racistes ou terroristes ?
Même avec les bonnes intentions, l’IA Générative peut mentir. Entraîner un modèle implique de lui montrer beaucoup de contenu pour qu’il puisse se forger une vision du monde. Le choix de ce que l’on montre à l’IA change ses réponses futures. Certains modèles de reconnaissance faciale détectent mieux les visages d’hommes blancs car aucun visage de femme, ou de personne à la couleur de peau différente, n’a été utilisé pour l’entraînement.
Que cela soit volontaire ou non, l’IA pourrait plonger l’humanité dans une ère de “post-vérité”. En plus, l’IA est très convaincante lorsqu’elle affirme un fait ou crée une image. On appelle même ces images (ex du Pape) des “deep fakes”. Charge à l’humanité de savoir prendre le recul nécessaire, pour trouver une “deep solution”.
D’autres défis majeurs existent :
Géopolitique : le développement d’IA générative avec des “Large Language Models” comme ChatGPT nécessite des dizaines de milliards d’euros d’investissement. Seuls quelques pays peuvent investir, et actuellement les US ont une avance considérable, via Open AI, Microsoft, Google, ou Facebook. En France, Mistral AI a levé 415 millions de dollars. C’est une super nouvelle, attention au chauvinisme : OpenAI avait levé 1 milliard pour son premier tour, il y a déjà 9 ans. Souhaitons quand même bon vent à Mistral.
Juridique : qui est responsable lorsque l'IA cause un préjudice ? Si un système d'IA crée une œuvre d'art ou invente un nouveau produit, qui détient les droits d'auteur ou le brevet ? L’IA pose de nombreuses questions juridiques, les avocats n’ont pas fini d’en parler. C’est leur droit.
Ces défis (aussi massifs soient-ils) sont autant de raisons pour entreprendre. Beaucoup de projets peuvent être lancés pour utiliser l’IA avec un objectif social ou climatique.
Merci encore à Quentin d’avoir co-écrit ce Plongeon avec moi. Si l’IA te passionne, abonne-toi à sa super newsletter.
Si tu veux lire l’épisode 2 (idées de jobs, de boites, inspirations, vocaux) ça se passe ici.
Si tu as décidé de plonger, retrouve la communauté du Plongeoir sur Discord pour en parler. Tu peux aussi lire les précédentes newsletters, notamment la dernière sur le futur du train.
Si tu veux devenir sponsor du Plongeoir : il suffit de répondre à l’e-mail.
J’ai deux derniers services à te demander :
Mets un petit like / commentaire avec ton ressenti, ça ne mange pas de pain et ça fait du bien.
Si tu as trouvé cette newsletter utile, partage-la. C’est uniquement comme ça que ce projet grandit. Directement par e-mail, ou Whatsapp / SMS ici 👇
À très vite,
Guillaume
" Et Dieu dans tout ça ? " aurait pu demander Jacques Chancel.
Franchement, me faire diriger par une super AI ne me fait pas fantasmer.
Après, en 2050, je ne me souviendrai peut-être plus que LinkedIn existe...
Très belle édition et géniale qu'elle soit écrite à 4 mains. Excellent de mêler ton expertise entrepreneuriat à impact avec l'expertise IA du Tunnel. Bravo à tous les 2 !