Faut-il vraiment prendre le train de l’IA en marche ?

L’IA avance à toute vitesse. DeepSeek, Mistral, RAG… Entre hype et usages concrets, comment ne pas monter à bord les yeux fermés ?

21/10/2025
Faut-il vraiment prendre le train de l’IA en marche ?

Cette fois, il faut prendre le train en marche !

Que ceux qui n'ont jamais entendu cette phrase nous jettent la première pierre, surtout ces derniers temps.

Dans le paysage de l'IA, les actualités s'enchaînent :

Ces éléments illustrent la vitesse à laquelle l'IA évolue et ses impacts dans tous les domaines. Les modèles d'IA fleurissent à vitesse grand V, ils s'améliorent, nécessitent de moins en moins de ressources. Le modèle Small V3 de MistralAI (24 milliards de paramètres) peut par exemple tourner sur des configurations abordables lorsqu'il est "compressé" (quantizé) mais délivrer toute sa puissance. La question se pose donc, faut-il monter dans le train et comment ?

Monter maintenant, n'est-ce pas adopter une solution qui sera peut-être obsolète demain ? Une chose est certaine, ne montez pas dans le train sans avoir identifié des cas d'usage.

Investir sur l'assistant dernier cri avec ses RAGs optimisés n'est pas une fin en soi (Si RAG ne vous parle pas, rendez-vous en bas du post).

L'IA générative permet de réaliser des gains de production sans même évoquer la notion de Chat. Un LLM peut intervenir au sein de processus métiers sans nécessité la présence d'un humain pour tailler le bout de gras. C'est pour cette raison qu'il faut réfléchir où l'IA peu avoir un apport réel au sein de l'entreprise, ce n'est pas la solution qui vous apportera cela. Pire, vous risquez d'investir dans une solution dont vous n'exploiterez pas les capacités.

Pour débuter, favorisez :

  • Les cas d'usage moins risqués, autrement dit ceux qui tolèrent une marge d'erreur.
  • Les cas d'usage qui concernent les processus reposant sur l'extraction, la catégorisation, la comparaison, la manipulation et l'analyse de données de documents non structurés.

Puis, identifiez les acteurs ou les partenaires qui peuvent vous accompagner sur ces premières briques.

Contenu de l’article

Aujourd'hui, le RAG !

Le Retrieval Augmented Generation, c'est "simple" :

  • Sans RAG lorsque vous soumettez votre question (prompt) à votre chatbot préféré, celle-ci est "directement" envoyée au LLM qui va ensuite générer du texte à partir des données sur lesquelles il a été entraîné.
  • Avec RAG : Avant d'envoyer la question au LLM, une recherche est réalisée dans des référentiels ou sources de données. Les informations récupérées sont ensuite envoyées au LLM avec la question.

Par exemple :

  • Vous posez (promptez) la question suivante : "Quel est le nombre de RTT que j'obtiens chaque année ?"
  • Si la question est directement envoyé à un Chat GPT ou équivalent, vous n'aurez bien entendu pas la réponse à votre question ou il s'agira d'une réponse aléatoire car il n'y a pas de contexte.
  • En revanche avec un RAG, votre question est "interceptée" et une recherche (souvent sémantique) est lancée dans une ou plusieurs sources de données (Base de données vectorielle/sql/nosql, fichiers, ...). Une fois les informations récupérées (contexte), le prompt est transformé puis envoyé au LLM.

"A partir des informations ci-dessous collectées dans le référentiel RH :

[ (Données récupérées par la recherche) Dans notre société, il y a tant de CP, tant de RTT, il faut poser ses congés X jours avant. Les congés exceptionnels sont... etc...] 

Peux-tu répondre à la question suivante :

Quel est le nombre de RTT que j'obtiens chaque année ?"

En fait il n'y a rien de magique, on utilise la capacité du LLM à générer du texte (token) pour qu'il produise une belle prose à partir de la question et des données remontées.

Mais avec le RAG viennent également d'autres enjeux, notamment la gestion de la gouvernance et de la sécurité des données.

[ RAG : Nous ne voyons pas d'autres explications... ]

En l'honneur de Davy NEDELEC, rédacteur de cet article.

Inscrivez-vous à la newsletter

Plus d’articles

Actualités
21/10/2025

Faut-il vraiment prendre le train de l’IA en marche ?

L’IA avance à toute vitesse. DeepSeek, Mistral, RAG… Entre hype et usages concrets, comment ne pas monter à bord les yeux fermés ?

Actualités

Actualités
18/9/2025

Ozitem, exposant au prochain salon AVTECH Summit 2025 à Biarritz

Nous avons le plaisir d’annoncer notre participation à l’AVTECH Summit, qui se tiendra à Biarritz les 15 & 16 octobre. Ce rendez-vous d’affaires incontournable dédié à la digitalisation et au pilotage des espaces des bâtiments, sera l’occasion pour notre équipe de vous accueillir sur notre stand, d’échanger autour de vos projets et de partager notre vision de la convergence entre l’IT et l’audiovisuel.

Actualités

Actualités
12/9/2025

Quel modèle d’IA choisir quand il y en a 1,3 million ?

De Hugging Face aux SLM spécialisés : comment s’y retrouver parmi la jungle des modèles IA et faire les bons choix selon vos usages ?

Actualités