Data & IA2 min de lecture

IA générative : comment l'intégrer dans vos process métier

LauraAGATE IT

9 septembre 2024

Integrer l'IA generative en entreprise

En 2025, on a deploye des solutions d'IA generative chez 4 clients. Voici ce qui marche vraiment, au-dela du buzz.

RAG : la brique incontournable

Le Retrieval-Augmented Generation reste le pattern le plus fiable. Sur une mission pour un cabinet juridique, on a indexe 15 000 documents dans une base vectorielle (Qdrant) avec des embeddings ada-002. Le chatbot interne repond avec les bonnes references dans 89% des cas, contre 40% en prompting direct.

Agents IA : au-dela du chatbot

L'Agentic AI change la donne. Avec LangChain et LangGraph, on a construit un agent qui orchestre 4 outils : recherche documentaire, requete SQL, calcul de pricing et generation de devis. Le temps de traitement d'une demande client est passe de 2 jours a 15 minutes.

Fine-tuning vs prompting

Le fine-tuning n'est pertinent que si vous avez un vocabulaire metier tres specifique et au moins 5 000 exemples annotes. Dans 80% des cas, un bon prompt engineering + RAG suffit et coute 10x moins.

Couts et deploiement

Budget API pour un usage moyen (50 000 requetes/mois) :

GPT-4o : environ 800 EUR/mois
Claude 3.5 Sonnet : environ 600 EUR/mois
Mistral Large : environ 400 EUR/mois

Pour le deploiement, Dataiku permet d'exposer les pipelines RAG en API sans gerer l'infra. On l'utilise sur 2 projets en production actuellement.

L'IA generative n'est pas magique. C'est de l'ingenierie, avec des couts et des limites mesurables.

IA générativeLLMChatGPTproductivitéRAG

Tous les articles

Laura

Consultant chez AGATE IT

Expert en data & ia, notre consultant partage ses retours d’expérience et ses bonnes pratiques pour vous aider dans vos projets.