Tout réinventer avec l'IA (2/2)
L'intelligence artificielle va transformer le monde. Il faut s'en emparer pour créer des projets à impact positif.
Hello, voilà la newsletter du Plongeoir #19.
L’IA est une technologie : elle n’est ni bonne, ni mauvaise. Elle est ce qu’on en fait. Elle peut permettre d’optimiser l’évasion fiscale, comme elle peut sauver des vies. Alors on crie un coup et on plonge ? Hiiii Haaaaa
Ce plongeon dans l'IA est propulsé par le startup studio français Imagination Machine (ou IM). Ils s’associent à des entrepreneurs pour créer, financer, et accélérer des projets ambitieux à impact social et/ou environnemental.
La thématique de l’IA au service de l’impact les passionne. Si tu veux co-fonder une start-up d’IA impact, contacte-les ici, tu seras bien reçu :)
Si ce n’est pas déjà fait tu peux aussi :
Me suivre sur LinkedIn.
T’abonner à la super newsletter IA de Quentin, qui a coécrit avec moi ce Plongeon.
Devenir sponsor du Plongeoir : il suffit de répondre à l’e-mail.
C’est partiiii
Si tu as 1 minute
Zoom 🔎 : comment créer une IA ? Il faut collecter et annoter de grandes quantités de données, utiliser des serveurs puissants et des équipes brillantes pour entraîner les modèles, miniaturiser pour gagner en efficacité. Rien de complexe, mais c’est fondamental de comprendre et de visualiser comment se positionnent des entreprises comme OpenAI, Hugging Face ou Mistral. Leurs modèles sont souvent publiés gratuitement, donc il est simple de créer ton projet IA.
Inspirations 👏 : Simplon a formé 1500 chômeurs à l'IA. Ecopia AI a cartographié l’Afrique subsaharienne, Idoven utilise l'IA pour détecter les maladies cardiaques, Deepmind a inventé 380 000 nouveaux matériaux. La liste est longue, et ultra inspirante.
Jobs ☝️ : + de 10 offres de jobs dans les plus belles boites d’IA à impact.
Idées de boites 💥 : découvre une méthode claire et des exemples concrets pour lancer ton projet IA.
Vocaux 📣 : On est gâtés en vocaux : Lou Welgryn, co-présidente de Data for Good, Frédéric Bardeau, président de Simplon.co, Roland Duffau, Directeur Général de Genesis, et Thomas Solignac, co-fondateur de Kayro.ai et Golem.ai.
Si avec ça tu n’as pas envie de plonger !
Si tu as 12 minutes
Au programme :
Zoom : comment créer une IA ?
Inspirations : l’IA pour le meilleur.
Jobs : ils recrutent.
Idées de boites : on plonge ?
Vocaux : conseils d’experts IA.
Allez go
Cet e-mail sera coupé avant la fin. Lis-le directement dans ton navigateur ici 👇
1. Zoom 🔎 : comment créer une IA ?
L’IA est une boite noire pour la plupart d’entre nous. On l’imagine trop complexe, alors on reste spectateurs. Pourtant, IA aucune raison d’avoir peur.
Il y a 6 étapes clefs pour créer une intelligence artificielle :
1. Collecter les données
Pas de datas, pas d’IA. Il faut :
Trouver d’immenses quantités de données. Ça parait bête mais c’est souvent compliqué. Roland (CEO de Genesis, écoute son vocal plus bas) m’expliquait la difficulté que c’était de collecter les résultats de 55 000 prélèvements de sols agricoles. De son coté, Open Food Fact a constitué une base de données gigantesque de produits alimentaires. Ca a notamment permis le développement de Yuka.
Traduire la donnée. Souviens-toi de notre newsletter 1/2 : pour ChatGPT, il a fallu traduire des mots en chiffres par exemple.
2. Annoter les données
Imaginons que j’ai collecté des millions d’images médicales de type mammographies, et que mon objectif est de détecter des cancers du sein. Il faut qu’un spécialiste annote chaque image, pour indiquer s’il y a un cancer ou non. C’est indispensable avant de lancer la phase d'entraînement.
C’est le métier de Desi Crew par exemple, qui annote des données bancaires, logistiques, médicales, ou encore agricoles, pour que des modèles IA puissent s’entraîner. Aussi, beaucoup de bases de données sont disponibles gratuitement, sur des plateformes comme Kaggle.
Kaggle ? Qu’est ce qu’elle à Kaggle ? Elle a par exemple cette base de données climatiques mondiales par ville, et cette base de données de production agricole par pays depuis 1961.
3. Trouver des GPUs
Un GPU est comme un cerveau ultrarapide. Il peut faire beaucoup de calculs en même temps. Imagine que tu doives résoudre des milliers de puzzles. Un ordinateur classique les résoudrait un par un. Un GPU pourrait travailler sur tous les puzzles simultanément. C’est pour ça qu’on les utilise en IA (les GPUs, pas les puzzles).
Nvidia est l'un des plus grands fabricants de GPUs. Leur valorisation actuelle est de 1500 Mds de dollars, 3 fois plus qu’il y a un an. C’est 2 fois la valo de Tesla, pour une boîte quasi inconnue du grand public. Beaucoup en ont peur : Google a décidé de développer ses propres puces spécialisées pour l'IA, appelées TPU (Tensor Processing Units), et OpenAI veut aussi investir dans les semi-conducteurs.
En France, Diamfab veut sortir son épingle du jeu en proposant de nouveaux semi-conducteurs en diamant, plus performants et écologiques.
4. Entraîner différents modèles
L’entraînement est très complexe. Il faut réunir une équipe de chercheurs brillants et des serveurs puissants. Dans les deux cas, c’est très cher, et très difficile à trouver. On peut être fiers de nos Gaulois : les meilleurs chercheurs au monde sortent de Polytechnique / ENS / Mines.
La France accélère sur l’IA. Après les 300m€ investis dans Kyutai, puis les 385m€ dans Mistral AI, on a appris mi-janvier que 2 chercheurs de Google Deepmind (dont un français) allaient se lancer à Paris et lever environ 200m€. On a toujours eu des talents en IA, mais on arrive enfin à les faire travailler en France.
Quentin, The Tunnel
En plus d’avoir les meilleurs chercheurs, il faut les machines les plus puissantes. Ces fameux GPUs consomment énormément d’énergie. Olivier Corradi a créé Electricity Maps. Ils prédisent à quel moment de la journée l’intensité carbone de l’électricité est la plus faible, dans tous les pays. Donc quand il est judicieux de faire tourner des GPUs.
5. Optimiser la performance du modèle
Une fois qu’un modèle a été entraîné et qu’il fonctionne, le plus gros enjeu est sa taille. Google a annoncé la sortie de son IA Gemini Nano (utilisable sur un smartphone) en même temps que celle de Gemini (un équivalent de ChatGPT).
Tu as sûrement entendu parler de la startup française Mistral. Sa valorisation est de 1,86 milliard d'euros moins d’un an après son lancement. Leur valeur ajoutée réside dans leur capacité à créer un modèle puissant, mais beaucoup moins gourmand.
En visant davantage l’efficacité que la course à la taille, entraîner un modèle leur coûtera 10 à 100 fois moins qu’un ChatGPT, et Mistral serait six fois moins coûteux en calcul pour les clients, aussi inquiets des dépenses.
Le Monde, 12 décembre 2023
Il existe probablement une loi de Pareto : 80% de la valeur sur 20% de la taille. Des chercheurs ont trouvé une formule mathématique qui permettrait d’estimer le nombre de paramètres minimum nécessaires.
Miniaturiser les modèles ne servirait pas qu’aux smartphones. On doit parfois embarquer de l’IA sur des appareils encore moins puissants. Pour identifier les départs de feux de forêt, le projet IA Pyronear utilise des Raspberry pi, soit des ordinateurs miniatures. L’enjeu est considérable : 58 900 hectares de forêt ont brûlé en France en 2022. Tout se joue dans les premières heures, et l’IA pourrait jouer un rôle clef.
Il y a un potentiel pour miniaturiser les modèles, et donc diminuer leur empreinte carbone. Mais la miniaturisation permettra surtout de généraliser l’IA partout. Attention à l’impact d’une surconsommation.
6. Créer un produit
Une fois toutes les étapes précédentes validées, il faut mettre l’IA entre les mains des utilisateurs finaux. La révolution ChatGPT est avant tout une innovation de produit et de distribution. Il existait des IA génératives performantes chez Google ou Microsoft, mais OpenAI a sorti un produit accessible à tous.
Toutes les grandes entreprises ont depuis sorti leur équivalent de ChatGPT : Bard pour Google, Copilot pour Microsoft, Ernie pour Baidu en Chine ou encore GigaChat en Russie.
Mais il n’est pas nécessaire d’être une multinationale pour créer un produit avec de l’IA. Il est possible d’utiliser les modèles Open Source. Ce sont des IA mise à dispo gratuitement. Mais pourquoi des géants qui ont dépensé des milliards offrent leurs modèles ?
Ils veulent bénéficier des contributions de tous les développeurs qui vont s’en emparer. C’est aussi un moyen de créer un modèle standard utilisé de tous, et d’améliorer leur image. Les revenus peuvent même être boostés par l’Open Source. De nombreux services payants sont proposés pour faciliter l’intégration du modèle dans un produit. Hors si la techno devient standard, tout le monde veut l’intégrer.
Hugging Face rend accessibles les modèles de ceux qui veulent bien les partager (489 318 à l’heure actuelle). Cette start-up qui vaut déjà $4,5Mds a été fondée par trois français. Elle est basée en Floride, et son plus gros bureau est parisien.
« Nous permettons à plus de 20 000 startups, organisations à but non lucratif ou entreprises de se lancer dans l'IA »
Clément Delangue, CEO Hugging Face, dans Les Echos.
2. Inspis 👏 : IA pour le meilleur
Voilà un petit boost d’inspirations : l’IA peut aider à construire des projets géniaux.
Réinsérer des chômeurs : Simplon est une école de formation (par Frederic, retrouve son vocal plus bas). Ils ont formé à l’IA 1500 chômeurs, embauchés dans 400 entreprises.
Booster les secouristes : Frédéric a formé 200 secouristes à utiliser des IA simples, pour maximiser leur productivité. Les ONG doivent s’emparent de l’IA.
Cartographier l’Afrique subsaharienne : Les cartes sont parfois approximatives, ce qui pose souci pour l’aide humanitaire. Ecopia AI (Canada, démarrage 2013) a cartographié 416 millions de bâtiments et 17 millions de kilomètres de routes africaines en moins de 8 mois grâce à l’IA.
Soutenir les artistes : Fairly Trained certifie les IA respectant les droits d'auteur. Sujet brûlant : les poursuites judiciaires se multiplient contre OpenAI, Meta, ou Midjourney par des artistes et des médias (ex New York Times).
Lutter contre les problèmes cardiaques : Idoven (Espagne, démarrage 2018, levées 22,5m€) analyse les électrocardiogrammes et aide les cliniciens à détecter les arythmies et maladies cardiovasculaires. Ils proposent aux gens de “donner leur rythme cardiaque” pour entraîner leur modèle.
Analyser les fonds marins : Panblue (Allemagne) et Wipsea (France) analysent les fonds marins via leur IA, et grâce à des images satellites.
Inventer des matériaux à l’infini : les matériaux existants se sont formés sur des millions d'années dans la nature (ex du Lithium). DeepMind a développé une IA (GnOME) qui a découvert 380 000 nouveaux matériaux. Ces données sont open source.
Inventer des ingrédients : AlphaFold est une IA qui prédit la structure 3D d'une protéine à partir de sa séquence d'acides aminés. Elle a été utilisée par plus d'un million de chercheurs, pour trouver de nouvelles alternatives aux protéines animales Mediterranean Food Lab (Israel), Cradle Bio (Suisse).
Développer l’agriculture régénératrice : Genesis utilise l’IA pour suivre l’état des sols agricoles. C’est l’indicateur numéro 1 de la transition agroécologique.
Réduire le gaspillage alimentaire : Wasteless développe les prix dynamiques pour supermarchés. Ils diminuent lorsqu’on approche de la date de péremption. Winnow, (UK, vient de lever $10m) filme les poubelles des restos en temps réel et interprète les images pour adapter les commandes. Kikleo est un équivalent français (Démarrage 2019, levée 1,5m€ en 2023).
Améliorer le tri des déchets : Lixo optimise la collecte de déchets via un système de vision & d’analyse image sur le camion poubelle.
Limiter les fuites d’eau : Leakmited (France) utilise l'IA et des images satellites pour détecter les 20% de réseaux d’eau où se situent 80% des fuites.
Réduire la consommation des cargos : Deepsea (démarrage 2017) utilise le routage par IA pour réduire les émissions de CO2 des cargos et réduire les coûts de carburant. Ils intègrent l’influence des courants et de la météo.
Réduire la consommation d’énergie : Accenta, Metron, Energiency sont des IA pour optimiser les consommations d’un bâtiment ou même d’une ligne de production.
3. Jobs ☝️: ils recrutent
Hugging Face (Remote & Paris) : International Finance & engineers
Electricity Maps (Danemark) : Head of marketing, sales
Mistral (Paris) : People, engineers & science
Panblue (Allemagne) : People & Culture
Idoven (Remote) : Head of product
Genesis (Remote) : Full stack dev
4. Idées 💥 : on plonge dans le grand bain ?
On ne peut pas se satisfaire des “IA qu'à faut qu'on”. A nous de créer des projets incroyables en utilisant le potentiel de l’intelligence artificielle pour construire le monde qu’on souhaite.
Pour lancer ton projet dans l’IA, tu as besoin de 4 éléments :
Une mission
Des données de qualité, en quantité
D’un modèle entraîné et performant
Un produit qui répond à un vrai problème
Choisis ta mission
Quel problème souhaites-tu résoudre ? Réduire le gaspillage alimentaire ? Améliorer la rentabilité des agriculteurs ? Réduire le gaspillage d’eau ? Améliorer la performance énergétique d’une industrie ? Choisis une mission que tu seras heureux (se) de défendre pendant au moins 10 ans.
Trouve tes données
Deux cas de figure peuvent se présenter :
La donnée liée à ta mission est disponible et facilement accessible. Tu peux la trouver sur Kaggle mais aussi sur le Dataset Search de Google.
La donnée n’est pas publique, mais tu sais comment la collecter. Peut être que tu travailles dans une usine et que tu suis chaque jour les données de consommation énergétique ? Tu es face à une opportunité.
Trouve un modèle
L’idée n’est pas de développer un nouveau modèle. Tu peux le faire, mais dans ce cas tu n’as pas besoin de cette newsletter, et tu peux directement passer un coup de fil à Xavier Niel.
Tu peux utiliser un des 489 318 modèles dispos sur Hugging Face, comme “Mixtral”, le modèle phare publié par notre frenchie Mistral.
Une fois ton modèle trouvé, il faut savoir l’utiliser. La première des choses à faire est de réentrainer le modèle (on parle aussi de fine-tuning). Lorsque Mistral a entraîné “Mixtral”, ils l’ont fait sur une quantité gigantesque de données parce qu’ils voulaient que leur modèle soit performant pour répondre à toutes les questions. Mais pour lancer un projet dans la santé par exemple, tu n’as pas besoin d’un modèle performant pour créer des scénarios de dessin animés.
Pour réentrainer un modèle, on lui fait programme quelques heures de rattrapage sur un sujet précis. Tu peux par exemple utiliser cette base de donnée sur Hugging Face si ton domaine est la santé mentale.
Crée un produit
Comme pour n’importe quel lancement de boîte, deviens obstiné par le besoin des clients. Est-ce que tu réponds à un vrai problème ?
Une fois qu’on s’est dit ça, je te recommande 4 principes :
Cherche les économies d’échelle : une IA qui optimise les consommations d’énergie d’usines est plus rentable et a plus d’impact qu’une IA qui optimise la consommation d’un radiateur de salle de bains.
Analyse les lois : tout ce qui permet de diminuer fortement les émissions de CO2 est ou sera poussé par des lois. Par exemple les nouvelles lois relatives au DPE (la note énergétique d’un bâtiment) accélèrent les besoins de rénovation. Upcylea propose une IA pour la sélection des matériaux durables.
Optimise le temps des profils qui manquent : on manque de médecins à la campagne par exemples. Une IA pour optimiser leur productivité est la bienvenue : Nabla promet de faire gagner 2h / jour aux médecins en automatisant les comptes rendus médicaux. Ils viennent de lever 22m€.
Pense multimodal : de nombreux modèles sont capables de fonctionner avec du texte, du son ou de l’image. Penses-y. Pour des personnes malentendantes, une IA peut traduire le son en texte ou en image comme Ava. Pour des personnes malvoyantes, une IA peut convertir du texte ou de l’image en son comme Seeing AI. Dans de nombreuses activités il est plus simple de travailler à l’oral (SAMU, médecin aux urgences), et dans d’autres à l’écrit (secrétariat, gestion de projet). L’IA peut optimiser la communication entre les corps de métier.
5. Vocaux 📣 : conseils d’experts.
Pour finir voici les conseils de 4 personnalités inspirantes du monde de l’IA.
Frédéric Bardeau, président Simplon.co
L’IA a un pouvoir social égalisateur
Les cas d’usage pour avoir de l’impact sont illimités
Lou Welgryn, co-présidente de Data for Good
Pense à la finalité du projet (la mission) en 1 : l’IA est un moyen, pas une fin
Roland Duffau, DG de Genesis, ex manager du “Responsible AI” chez Google
Identifie l’enjeu à adresser et assure-toi qu’il y a un marché
Cherche la donnée avant l’algo
Tester beaucoup de modèles, surtout les plus simples
Thomas Solignac, Co-fondateur de Kayro.ai et Golem.ai
Comme au début d’internet : il faut réinventer chaque métier. Lequel tu connais ?
Favorise les IAs existantes, ne fais pas trop de R&D et garde de l’humain.
L’IA est un moyen, pas une fin. Reste focus sur les problèmes des clients.
Voilà, c’est terminé pour ce plongeon dans l’IA. Merci encore à Quentin d’avoir coécrit avec moi. Si l’IA te passionne, abonne-toi à sa super newsletter.
Si tu as décidé de plonger, retrouve la communauté du Plongeoir sur Discord pour en parler. Tu peux aussi lire les précédentes newsletters.
Si tu veux devenir sponsor du Plongeoir : il suffit de répondre à l’e-mail.
J’ai deux derniers services à te demander :
Mets un petit like / commentaire avec ton ressenti, ça ne mange pas de pain et ça fait du bien.
Si tu as trouvé cette newsletter utile, partage-la. C’est uniquement comme ça que ce projet grandit. Directement par e-mail, ou Whatsapp / SMS ici 👇
À très vite,
Guillaume
Merci Guillaume, j'aime beaucoup ce que tu fais, continue.
super article merci ! j'ai particulièrement apprécié la vulgarisation du sujet, et le focus sur le besoin final