ia pour les nuls 1068x580

Formation professionnelle

02 juin 2025

L’IA pour les nuls qui veulent y voir un peu plus clair… Ca en fait du monde ????

Aujourd’hui quand on parle d’IA on parle le plus souvent d’IA générative. Cette IA capable de créer du contenu original à partir de ce qu’elle a appris a été rendue très populaire auprès du grand public par Chat GPT et c’est certainement la forme d’IA la plus accessible pour ce dernier avec des cas d’usages évidents.

Mais l’IA est un domaine riche et assez ancien : les premiers travaux sur le sujet datent des années 50 mais est resté un sujet compliqué réservé aux spécialistes et un peu abscons pour le commun des mortels même s’il y a une dizaine d’années IBM Waston plateforme d’intelligence artificielle hybride, qui combine NLP, machine learning, automatisation et raisonnement symbolique (Qu’est-ce que l’informatique cognitive ? L’exemple d’IBM Watson) avait attiré l’attention.

Mais pour que l’IA devienne un sujet de société il aura logiquement fallu qu’elle rentre dans les foyers (merci ChatGPT) mais la médaille a un revers : à force de ne voir que ce type d’outil on oublie qu‘il existe pleins d’autres formes d’IA, à tel point que certains craignent que s’il existe une bulle de l’IA Générative son explosion pourrait faire mal à tout le secteur malgré le fait qu’il existe des types d’IA mures avec un business établi et qui font leurs preuves depuis longtemps (L’IA vers une impasse économique ?)

L’IA générative ne peut pas tout faire et cela tombe bien, elle n’est pas faite pour tout faire. L’autre jour je faisais la liste des cas d’usages potentiels de l’IA pour une gouvernance d’entreprise et cela a été l’occasion de me rendre compte qu’à chaque cas correspondant un type d’IA qui avait son propre mode de fonctionnement.

« … » Les grandes familles d’IA : ce que l’IA cherche à faire

On peut commencer par distinguer l’IA selon sa finalité. Que cherche-t-elle à accomplir ? Pour quoi peut on s’en servir.

Pour cela un tableau vaut mieux que des grandes phrases :

Type d’IA But Exemples
IA prédictive Prévoir ce qui va se passer Prévision des ventes, détection de fraude
IA descriptive Expliquer ce qui s’est passé Analyse de sentiments, clustering de clients
IA générative Créer du contenu ChatGPT, DALL·E, Midjourney
IA prescriptive Recommander une action Recommandation de produits, GPS
IA conversationnelle Dialoguer avec des humains Chatbots, assistants vocaux
IA cognitive Simuler le raisonnement humain Systèmes experts, moteurs de règles
IA explicable Rendre les décisions compréhensibles SHAP, LIME, audits de modèles
IA adaptative Apprendre en temps réel Agents autonomes, IA embarquée
IA embarquée Fonctionner localement, sans connexion Objets connectés, caméras intelligentes
IA agentique Agir de manière autonome dans un environnement AutoGPT, copilotes métier, assistants proactifs

Et bien oui, quand vous utilisez un GPS pour trouver votre chemin il y a de l’IA dedans…

Une petite précision sur l’IA agentique puisque cela sera surement celle qui va rapidement transformer notre quotidien et qu’on a trop tendance à vouloir assimiler à une IA générative évoluée.

En fait ces IA ne sont pas elles-mêmes des modèles génératifs, mais elles s’appuient largement sur ces modèles (comme GPT) pour comprendre, raisonner, générer et interagir. Autrement dit : les modèles génératifs sont une brique clé qui rend les agents plus intelligents, plus adaptatifs, et plus autonomes mais on ne peut réduire ces IA à ces modèles.

Et l’AGI, l’intelligence artificielle générale ? Elle n’existe pas encore donc on verra plus tard.

Maintenant se pose la question de savoir comment elles fonctionnent pour y parvenir, ce qui explique que chacune a son terrain de jeu et ses limites.

Les grandes méthodes d’apprentissage : comment l’IA apprend

Je ne suis pas friand du terme « intelligence » parce que ce qui distingue avant tout l’IA c’est sa capacité à apprendre. Et elle le fait de diverses manières.

Méthode Idée Exemple d’application
Apprentissage supervisé L’IA apprend avec des données étiquetées Prédiction de churn, reconnaissance d’image, GPT, LLaMA, Copilot
Apprentissage non supervisé L’IA découvre des groupes ou modèles cachés Segmentation client, clustering
Apprentissage par renforcement L’IA apprend par essais et erreurs Jeu déchecs, robotique
Apprentissage symbolique L’IA applique des règles logiques Systèmes experts, moteurs d’inférence
Deep learning L’IA apprend via des réseaux neuronaux profonds Reconnaissance vocale, vision, GPT, LLaMA, Copilot
Few-shot / Zero-shot L’IA généralise avec peu ou pas d’exemples GPT, LLaMA, Copilot

On peut s’étonner de voir des IA Génératives dans la catégorie « few shots » (en tout cas ça a été mon cas) mais il faut comprendre qu’elles suivent plusieurs étapes.

Un outil comme ChatGPT a été pré-entraîné sur des milliards de textes (apprentissage auto-supervisé, via deep learning) : c’est ce qu’on appelle le pretraining : il apprend le langage, les structures, les concepts.

Mais ensuite, une fois entraîné, on peut l’utiliser en few-shot ou zero-shot.

Zero-shot car si on lui pose une question sans exemple il comprend et répond directement et few-shot car si on lui donne quelques exemples il va adapter sa réponse au contexte. C’est le cas par exemple quand vous « éduquez » une IA à adopter un style donné.

C’est donc dans l’usage que le modèle est few-shot/zero-shot, pas dans son entraînement lui-même.

Ce que l’IA manipule : les briques technologiques

On a parlé de la finalité, de la manière dont l’IA se dote du potentiel (connaissance) nécessaire pour l’atteindre, reste la manière dont elle utilise ce potentiel.

Elle va le mobiliser dans des briques technologiques dont chacune a son utilité, son fonctionnement, et ses cas d’usage métier.

Technologie Utilité principale Exemple Cas d’usage métier
NLP (natural language processing) Comprendre les textes Analyse de commentaires Support client, e-réputation, veille
OCR (Optical Character Recognition) Lire du texte dans une image Scanner une facture Traitement de documents, archivage
Vision par ordinateur Reconnaître des objets et des formes Détection de défauts Contrôle qualité, sécurité, comptage en magasin
LLM (Large Language Models) Générer et comprendre le langage naturel ChatGPT, Copilot Assistance à la rédaction, agents intelligents
RPA (Robotic Process Automation) Automatiser des tâches répétitives Saisie de données Back-office, RH, finance
GANs (Generative Adversarial Networks) Générer des images Création artistique Publicité, design, prototypage
Modèles de diffusion Créer des visuels réalistes Midjourney, DALL·E Illustration marketing, aide à la conception
Speech-to-text Transcrire la voix Sous-titrage automatique Médias, santé, transcription juridique
Chatbots Dialoguer automatiquement FAQ automatisée Service client, support interne
Systèmes experts Raisonnement logique via règles Diagnostic technique Maintenance, fiscalité, juridique
Systèmes de recommandation Suggérer un choix Suggestions de films E-commerce, RH, éducation en ligne
Outils d’explicabilité Expliquer les décisions d’IA SHAP, LIME Conformité, audit modèles, assurance
IA embarquée Fonctionner localement en temps réel Caméra intelligente Drones, objets connectés, automobile
NLG (Natural Language Generation) Générer du texte automatiquement Rapports automatiques Finance, assurance, sport

Si vous vous demandez ce qui différencie les LLM du NLG sachez que je me suis également posé la question.

Disons que des LLM comme GPT 4 peuvent faire de la génération de contenu (assez évident à comprendre) mais qu’on peut faire du NLG sans LLM via des systèmes plus simples (règles, modèles statistiques…).

Prenons l’exemple d’un bulletin météo généré automatiquement. On va utilisera des données météorologiques contenues dans une base de données et ensuite un moteur de règles va les repositionner dans une phrase pour donner quelque chose comme « Ce matin, le ciel sera partiellement couvert avec 18°C. L’après-midi, les températures grimperont à 23°C avec un vent modéré de sud-ouest. »

Pareil pour les GANs et les modèles de diffusion. Alors, si j’ai bien compris ce qu’on m’a expliqué, ce sont deux technologies qui permettent à l’IA de générer des images, mais elles fonctionnent de manières très différentes.

Les GANs, c’est un peu comme deux artistes en compétition : le premier invente une image, le deuxième doit dire si elle est vraie ou fausse, le premier essaie de tromper le deuxième, et ils s’améliorent à chaque tour avec pour résultat des images de plus en plus réalistes.

Les modèles de diffusion, eux, partent d’un gribouillis aléatoire (comme du bruit) et retirent petit à petit ce bruit jusqu’à faire apparaître une image nette. C’est plus lent, mais souvent plus stable et plus précis.

Aujourd’hui ce sont les modèles de diffusion qui dominent dans le monde de l’IA (DALL·E, Midjourney…) mais le nouveau générateur d’images de ChatGPT a récemment changé la donne en utilisant un « une approche prédictive multimodale intégrée, générant du contenu via un réseau neuronal unique entraîné simultanément sur texte, images et audio » totalement différente du processus de débruitage itératif propre des modèles par diffusion.

Conclusion (sans jargon)

Quand on pense « produit », beaucoup de solutions IA vont en fait intégrer différents types d’IA, donc différents modèles d’apprentissage au service de plusieurs briques pour satisfaire un cas d’usage donnée, surtout s’il est complexe.

Il n’existe pas une IA mais plusieurs types, avec des objectifs différents et ce que chacune fait dépend de la façon dont elle apprend.

Chaque technologie est donc une brique spécifique, au service d’un usage précis.

Ce n’est pas parce qu’une entreprise « fait de l’IA » que c’est nécessairement innovant. Ce qui compte, c’est pour quoi elle l’utilise, comment, et avec quelle valeur ajoutée concrète.

La prochaine fois qu’on vous parle d’IA, vous saurez (j’espère) poser la bonne question : de quel type d’IA s’agit-il, et pour quoi faire ?

By Bertrand DUPERRIN – 29 avril 2025

Illustration : générée par IA via ChatGPT / DALL·E

Retour en haut