Aujourd’hui quand on parle d’IA on parle le plus souvent d’IA générative. Cette IA capable de créer du contenu original à partir de ce qu’elle a appris a été rendue très populaire auprès du grand public par Chat GPT et c’est certainement la forme d’IA la plus accessible pour ce dernier avec des cas d’usages évidents.
Mais l’IA est un domaine riche et assez ancien : les premiers travaux sur le sujet datent des années 50 mais est resté un sujet compliqué réservé aux spécialistes et un peu abscons pour le commun des mortels même s’il y a une dizaine d’années IBM Waston plateforme d’intelligence artificielle hybride, qui combine NLP, machine learning, automatisation et raisonnement symbolique (Qu’est-ce que l’informatique cognitive ? L’exemple d’IBM Watson) avait attiré l’attention.
Mais pour que l’IA devienne un sujet de société il aura logiquement fallu qu’elle rentre dans les foyers (merci ChatGPT) mais la médaille a un revers : à force de ne voir que ce type d’outil on oublie qu‘il existe pleins d’autres formes d’IA, à tel point que certains craignent que s’il existe une bulle de l’IA Générative son explosion pourrait faire mal à tout le secteur malgré le fait qu’il existe des types d’IA mures avec un business établi et qui font leurs preuves depuis longtemps (L’IA vers une impasse économique ?)
L’IA générative ne peut pas tout faire et cela tombe bien, elle n’est pas faite pour tout faire. L’autre jour je faisais la liste des cas d’usages potentiels de l’IA pour une gouvernance d’entreprise et cela a été l’occasion de me rendre compte qu’à chaque cas correspondant un type d’IA qui avait son propre mode de fonctionnement.
« … » Les grandes familles d’IA : ce que l’IA cherche à faire
On peut commencer par distinguer l’IA selon sa finalité. Que cherche-t-elle à accomplir ? Pour quoi peut on s’en servir.
Pour cela un tableau vaut mieux que des grandes phrases :
Type d’IA | But | Exemples |
IA prédictive | Prévoir ce qui va se passer | Prévision des ventes, détection de fraude |
IA descriptive | Expliquer ce qui s’est passé | Analyse de sentiments, clustering de clients |
IA générative | Créer du contenu | ChatGPT, DALL·E, Midjourney |
IA prescriptive | Recommander une action | Recommandation de produits, GPS |
IA conversationnelle | Dialoguer avec des humains | Chatbots, assistants vocaux |
IA cognitive | Simuler le raisonnement humain | Systèmes experts, moteurs de règles |
IA explicable | Rendre les décisions compréhensibles | SHAP, LIME, audits de modèles |
IA adaptative | Apprendre en temps réel | Agents autonomes, IA embarquée |
IA embarquée | Fonctionner localement, sans connexion | Objets connectés, caméras intelligentes |
IA agentique | Agir de manière autonome dans un environnement | AutoGPT, copilotes métier, assistants proactifs |
Et bien oui, quand vous utilisez un GPS pour trouver votre chemin il y a de l’IA dedans…
Une petite précision sur l’IA agentique puisque cela sera surement celle qui va rapidement transformer notre quotidien et qu’on a trop tendance à vouloir assimiler à une IA générative évoluée.
En fait ces IA ne sont pas elles-mêmes des modèles génératifs, mais elles s’appuient largement sur ces modèles (comme GPT) pour comprendre, raisonner, générer et interagir. Autrement dit : les modèles génératifs sont une brique clé qui rend les agents plus intelligents, plus adaptatifs, et plus autonomes mais on ne peut réduire ces IA à ces modèles.
Et l’AGI, l’intelligence artificielle générale ? Elle n’existe pas encore donc on verra plus tard.
Maintenant se pose la question de savoir comment elles fonctionnent pour y parvenir, ce qui explique que chacune a son terrain de jeu et ses limites.
Les grandes méthodes d’apprentissage : comment l’IA apprend
Je ne suis pas friand du terme « intelligence » parce que ce qui distingue avant tout l’IA c’est sa capacité à apprendre. Et elle le fait de diverses manières.
Méthode | Idée | Exemple d’application |
Apprentissage supervisé | L’IA apprend avec des données étiquetées | Prédiction de churn, reconnaissance d’image, GPT, LLaMA, Copilot |
Apprentissage non supervisé | L’IA découvre des groupes ou modèles cachés | Segmentation client, clustering |
Apprentissage par renforcement | L’IA apprend par essais et erreurs | Jeu déchecs, robotique |
Apprentissage symbolique | L’IA applique des règles logiques | Systèmes experts, moteurs d’inférence |
Deep learning | L’IA apprend via des réseaux neuronaux profonds | Reconnaissance vocale, vision, GPT, LLaMA, Copilot |
Few-shot / Zero-shot | L’IA généralise avec peu ou pas d’exemples | GPT, LLaMA, Copilot |
On peut s’étonner de voir des IA Génératives dans la catégorie « few shots » (en tout cas ça a été mon cas) mais il faut comprendre qu’elles suivent plusieurs étapes.
Un outil comme ChatGPT a été pré-entraîné sur des milliards de textes (apprentissage auto-supervisé, via deep learning) : c’est ce qu’on appelle le pretraining : il apprend le langage, les structures, les concepts.
Mais ensuite, une fois entraîné, on peut l’utiliser en few-shot ou zero-shot.
Zero-shot car si on lui pose une question sans exemple il comprend et répond directement et few-shot car si on lui donne quelques exemples il va adapter sa réponse au contexte. C’est le cas par exemple quand vous « éduquez » une IA à adopter un style donné.
C’est donc dans l’usage que le modèle est few-shot/zero-shot, pas dans son entraînement lui-même.
Ce que l’IA manipule : les briques technologiques
On a parlé de la finalité, de la manière dont l’IA se dote du potentiel (connaissance) nécessaire pour l’atteindre, reste la manière dont elle utilise ce potentiel.
Elle va le mobiliser dans des briques technologiques dont chacune a son utilité, son fonctionnement, et ses cas d’usage métier.
Technologie | Utilité principale | Exemple | Cas d’usage métier |
NLP (natural language processing) | Comprendre les textes | Analyse de commentaires | Support client, e-réputation, veille |
OCR (Optical Character Recognition) | Lire du texte dans une image | Scanner une facture | Traitement de documents, archivage |
Vision par ordinateur | Reconnaître des objets et des formes | Détection de défauts | Contrôle qualité, sécurité, comptage en magasin |
LLM (Large Language Models) | Générer et comprendre le langage naturel | ChatGPT, Copilot | Assistance à la rédaction, agents intelligents |
RPA (Robotic Process Automation) | Automatiser des tâches répétitives | Saisie de données | Back-office, RH, finance |
GANs (Generative Adversarial Networks) | Générer des images | Création artistique | Publicité, design, prototypage |
Modèles de diffusion | Créer des visuels réalistes | Midjourney, DALL·E | Illustration marketing, aide à la conception |
Speech-to-text | Transcrire la voix | Sous-titrage automatique | Médias, santé, transcription juridique |
Chatbots | Dialoguer automatiquement | FAQ automatisée | Service client, support interne |
Systèmes experts | Raisonnement logique via règles | Diagnostic technique | Maintenance, fiscalité, juridique |
Systèmes de recommandation | Suggérer un choix | Suggestions de films | E-commerce, RH, éducation en ligne |
Outils d’explicabilité | Expliquer les décisions d’IA | SHAP, LIME | Conformité, audit modèles, assurance |
IA embarquée | Fonctionner localement en temps réel | Caméra intelligente | Drones, objets connectés, automobile |
NLG (Natural Language Generation) | Générer du texte automatiquement | Rapports automatiques | Finance, assurance, sport |
Si vous vous demandez ce qui différencie les LLM du NLG sachez que je me suis également posé la question.
Disons que des LLM comme GPT 4 peuvent faire de la génération de contenu (assez évident à comprendre) mais qu’on peut faire du NLG sans LLM via des systèmes plus simples (règles, modèles statistiques…).
Prenons l’exemple d’un bulletin météo généré automatiquement. On va utilisera des données météorologiques contenues dans une base de données et ensuite un moteur de règles va les repositionner dans une phrase pour donner quelque chose comme « Ce matin, le ciel sera partiellement couvert avec 18°C. L’après-midi, les températures grimperont à 23°C avec un vent modéré de sud-ouest. »
Pareil pour les GANs et les modèles de diffusion. Alors, si j’ai bien compris ce qu’on m’a expliqué, ce sont deux technologies qui permettent à l’IA de générer des images, mais elles fonctionnent de manières très différentes.
Les GANs, c’est un peu comme deux artistes en compétition : le premier invente une image, le deuxième doit dire si elle est vraie ou fausse, le premier essaie de tromper le deuxième, et ils s’améliorent à chaque tour avec pour résultat des images de plus en plus réalistes.
Les modèles de diffusion, eux, partent d’un gribouillis aléatoire (comme du bruit) et retirent petit à petit ce bruit jusqu’à faire apparaître une image nette. C’est plus lent, mais souvent plus stable et plus précis.
Aujourd’hui ce sont les modèles de diffusion qui dominent dans le monde de l’IA (DALL·E, Midjourney…) mais le nouveau générateur d’images de ChatGPT a récemment changé la donne en utilisant un « une approche prédictive multimodale intégrée, générant du contenu via un réseau neuronal unique entraîné simultanément sur texte, images et audio » totalement différente du processus de débruitage itératif propre des modèles par diffusion.
Conclusion (sans jargon)
Quand on pense « produit », beaucoup de solutions IA vont en fait intégrer différents types d’IA, donc différents modèles d’apprentissage au service de plusieurs briques pour satisfaire un cas d’usage donnée, surtout s’il est complexe.
Il n’existe pas une IA mais plusieurs types, avec des objectifs différents et ce que chacune fait dépend de la façon dont elle apprend.
Chaque technologie est donc une brique spécifique, au service d’un usage précis.
Ce n’est pas parce qu’une entreprise « fait de l’IA » que c’est nécessairement innovant. Ce qui compte, c’est pour quoi elle l’utilise, comment, et avec quelle valeur ajoutée concrète.
La prochaine fois qu’on vous parle d’IA, vous saurez (j’espère) poser la bonne question : de quel type d’IA s’agit-il, et pour quoi faire ?
By Bertrand DUPERRIN – 29 avril 2025
Illustration : générée par IA via ChatGPT / DALL·E