Faut-il vraiment prendre le train de l’IA en marche ?

L’IA avance à toute vitesse. DeepSeek, Mistral, RAG… Entre hype et usages concrets, comment ne pas monter à bord les yeux fermés ?

Actualités

21/10/2025

Faut-il vraiment prendre le train de l’IA en marche ?

Cette fois, il faut prendre le train en marche !

Que ceux qui n'ont jamais entendu cette phrase nous jettent la première pierre, surtout ces derniers temps.

Dans le paysage de l'IA, les actualités s'enchaînent :

Le coup d'éclat de DeepSeek - https://www.usine-digitale.fr/article/deepseek-cette-start-up-chinoise-qui-fait-mieux-qu-openai-pour-96-moins-cher.N2226172
La sortie Précoce de Lucie (je soutiens cette initiative d'IA souveraine, force à eux) https://www.francetvinfo.fr/internet/intelligence-artificielle/erreurs-factuelles-absence-de-moderation-les-debuts-rates-de-l-intelligence-artificielle-francaise-lucie-moquee-sur-les-reseaux-sociaux_7037849.html
Une suspicion de plagiat - https://www.lopinion.fr/economie/deepseek-lia-chinoise-prouesse-ou-plagiat
Puis la sortie de Mistral Small V3 sous licence Apache ! - https://www.usine-digitale.fr/article/mistral-fait-les-yeux-doux-a-la-communaute-open-source-avec-son-dernier-modele-small-3.N2226631

Ces éléments illustrent la vitesse à laquelle l'IA évolue et ses impacts dans tous les domaines. Les modèles d'IA fleurissent à vitesse grand V, ils s'améliorent, nécessitent de moins en moins de ressources. Le modèle Small V3 de MistralAI (24 milliards de paramètres) peut par exemple tourner sur des configurations abordables lorsqu'il est "compressé" (quantizé) mais délivrer toute sa puissance. La question se pose donc, faut-il monter dans le train et comment ?

Monter maintenant, n'est-ce pas adopter une solution qui sera peut-être obsolète demain ? Une chose est certaine, ne montez pas dans le train sans avoir identifié des cas d'usage.

Investir sur l'assistant dernier cri avec ses RAGs optimisés n'est pas une fin en soi (Si RAG ne vous parle pas, rendez-vous en bas du post).

L'IA générative permet de réaliser des gains de production sans même évoquer la notion de Chat. Un LLM peut intervenir au sein de processus métiers sans nécessité la présence d'un humain pour tailler le bout de gras. C'est pour cette raison qu'il faut réfléchir où l'IA peu avoir un apport réel au sein de l'entreprise, ce n'est pas la solution qui vous apportera cela. Pire, vous risquez d'investir dans une solution dont vous n'exploiterez pas les capacités.

‍

Pour débuter, favorisez :

Les cas d'usage moins risqués, autrement dit ceux qui tolèrent une marge d'erreur.
Les cas d'usage qui concernent les processus reposant sur l'extraction, la catégorisation, la comparaison, la manipulation et l'analyse de données de documents non structurés.

Puis, identifiez les acteurs ou les partenaires qui peuvent vous accompagner sur ces premières briques.

Aujourd'hui, le RAG !

Le Retrieval Augmented Generation, c'est "simple" :

Sans RAG lorsque vous soumettez votre question (prompt) à votre chatbot préféré, celle-ci est "directement" envoyée au LLM qui va ensuite générer du texte à partir des données sur lesquelles il a été entraîné.
Avec RAG : Avant d'envoyer la question au LLM, une recherche est réalisée dans des référentiels ou sources de données. Les informations récupérées sont ensuite envoyées au LLM avec la question.

Par exemple :

Vous posez (promptez) la question suivante : "Quel est le nombre de RTT que j'obtiens chaque année ?"
Si la question est directement envoyé à un Chat GPT ou équivalent, vous n'aurez bien entendu pas la réponse à votre question ou il s'agira d'une réponse aléatoire car il n'y a pas de contexte.
En revanche avec un RAG, votre question est "interceptée" et une recherche (souvent sémantique) est lancée dans une ou plusieurs sources de données (Base de données vectorielle/sql/nosql, fichiers, ...). Une fois les informations récupérées (contexte), le prompt est transformé puis envoyé au LLM.

"A partir des informations ci-dessous collectées dans le référentiel RH :

[ (Données récupérées par la recherche) Dans notre société, il y a tant de CP, tant de RTT, il faut poser ses congés X jours avant. Les congés exceptionnels sont... etc...]

Peux-tu répondre à la question suivante :

Quel est le nombre de RTT que j'obtiens chaque année ?"

En fait il n'y a rien de magique, on utilise la capacité du LLM à générer du texte (token) pour qu'il produise une belle prose à partir de la question et des données remontées.

Mais avec le RAG viennent également d'autres enjeux, notamment la gestion de la gouvernance et de la sécurité des données.

[ RAG : Nous ne voyons pas d'autres explications... ]

En l'honneur de Davy NEDELEC, rédacteur de cet article.

Sommaire

Aucun titre dans cet article

Example H3

Example H4

Plus d’articles

Actualités

18/11/2025

Au-delà du PowerPoint : pourquoi l'alliance conseil et ESN est la clé de la réussite opérationnelle

En 2025, 48 % des entreprises françaises utilisent déjà des agents IA, tandis que la pénétration de l’IA générative atteint 76 % dans les grandes entreprises. Les cabinets de conseil sont ainsi fortement impliqués dans la mise en œuvre de ces technologies : l’usage de l’IA dans leur offre est devenu un critère clé de sélection pour leurs clients.

Lire l’article

Actualités

21/10/2025