Qu'est-ce qu'un diagnostic IA d'entreprise ?

Un diagnostic IA d'entreprise évalue la maturité des données, identifie les cas d'usage viables et produit des arbitrages documentés (à faire / éviter / différer). Le livrable est co-signé par la Direction Technique et reste confidentiel.

Faut-il un diagnostic avant de lancer un projet IA ?

Oui — un diagnostic IA permet d'identifier les cas d'usage viables, d'évaluer la maturité des données et d'éviter les investissements mal ciblés. La majorité des projets IA qui échouent n'ont pas eu de phase d'arbitrage préalable.

Combien coûte un diagnostic IA ?

Le diagnostic IA Studio CodeAI est proposé à partir de 5 000 € HT. Il comprend l'analyse de maturité, la cartographie des cas d'usage, les arbitrages à faire/éviter/différer et une feuille de route co-signée.

Notre méthodologie

Des agents IA qui ne mentent pas.

Notre approche transforme les prompts en systèmes vérifiables, traçables et auditables — conçus pour la production, pas pour la démo.

Le problème

Un prompt ne suffit pas.

Un prompt bien écrit produit une démo impressionnante. Mais en production, face à des centaines de cas réels, les hallucinations, la dérive de contexte et l'absence de traçabilité transforment un outil prometteur en risque opérationnel.

Prompt naïf

✕Sortie invérifiable — aucune source citée
✕Hallucination silencieuse — API inventées, faits erronés
✕Dérive en session longue — le contexte se pollue
✕Garde-fous consultatifs — le modèle peut les ignorer
✕Résultat variable d'un jour à l'autre (±8-14 %)
✕Aucun audit possible — boîte noire

Architecture Studio CodeAI

✓Chaque affirmation traçable à sa source primaire
✓Documentation à jour injectée en temps réel (MCP)
✓Contexte isolé par sous-agent — pas de pollution croisée
✓Garde-fous déterministes — non contournables par le modèle
✓Résultat reproductible — la fiabilité est dans l'architecture
✓Escalade en sécurité — « je ne sais pas » plutôt que mentir

Notre philosophie

Cinq piliers pour des agents fiables

Nous n'ingénierons pas le modèle — il est gelé. Nous ingénierons ce qui l'atteint et combien de fois il se corrige.

Contexte, pas prompt

La qualité dépend du contexte assemblé (5 000 à 50 000 tokens), pas des 6 mots que vous tapez. Nous construisons le contexte effectif avec précision.

Budget de contexte

Plus de contexte ≠ mieux. Nous chargeons la bonne information au bon moment (juste-à-temps), jamais en vrac — pour garder le signal propre.

Fiabilité hors du modèle

Ce qui doit être fiable ne dépend pas du bon vouloir du modèle. Restrictions d'outils, hooks déterministes, schémas de validation — non contournables.

Vérification architecturale

Chaque sortie est confrontée à une source de vérité. La vérification est une étape construite dans la boucle, pas une intention pieuse.

Provenance hiérarchisée

Source primaire > source curatée > mémoire du modèle. Chaque affirmation est traçable. L'agent qui ne trouve pas de source ne répond pas — il escalade.

Le processus

De l'avant-vente au suivi — 8 étapes, 2 portes

Chaque étape produit un livrable traçable. Les deux portes GO/NO-GO sont des arrêts obligatoires — rien n'avance tant qu'elles ne sont pas franchies.

É.0

Avant-vente & cadrage commercial

Qualification du besoin, filtre de rentabilité (l'erreur coûte-t-elle cher ? la tâche est-elle répétitive ? la sortie est-elle vérifiable ?), proposition et rédaction de la charte projet.

→ Proposition + charte signée

É.1

Interviews & découverte

Interviews métier avec les utilisateurs finaux. Questionnaire de cadrage structuré : quelle est la source de vérité ? quel est le coût d'une erreur ? que se passe-t-il en cas de doute ? comment vérifie-t-on une sortie ?

→ REQUEST (cahier de cadrage)

É.2

Faisabilité & validation de la philosophie

Définition de la source de vérité, du schéma de provenance, des garde-fous déterministes nécessaires. Analyse de faisabilité technique.

→ RESEARCH (analyse de faisabilité)

Porte

GO / NO-GO — Cadrage

Le cas coche-t-il les 3 conditions ? La source de vérité est-elle accessible ? Les garde-fous sont-ils implémentables ? Si non — on le dit. Un NO-GO honnête protège le client autant que nous.

→ Verdict GO / GO conditionnel / NO-GO

É.3

Conception de l'architecture agentique

Décomposition en agents à responsabilité unique (parser, validateur, rédacteur). Choix des couches déterministes, schémas de sortie, routage de modèle, plan d'itération.

→ PLAN (architecture + garde-fous)

É.4

Construction technique

Implémentation de l'arborescence .claude/ (agents, commands, skills, settings), branchement MCP pour documentation à jour, hooks déterministes, mémoire d'agent persistante.

→ Agent fonctionnel

É.5

Vérification & recette

Jeu de tests canary, contrôle de provenance (chaque sortie pointe-t-elle sa source ?), test d'escalade (l'agent refuse-t-il proprement en cas de doute ?), checklist de revue pré-livraison.

→ Rapport de recette

Porte

Recette validée

L'agent échoue-t-il en sécurité ? La provenance est-elle traçable ? Les garde-fous sont-ils déterministes (non de simples consignes) ? Si un seul critère échoue — on corrige avant de livrer.

→ Feu vert livraison

É.6

Livraison

Trois modes combinables selon votre contexte : installation sur vos postes (autonomie + formation), remise du dépôt/template (intégration + documentation), ou hébergement managé par Studio CodeAI (service opéré + SLA).

→ Agent déployé + documentation

É.7

Suivi & amélioration continue

Monitoring de qualité, suite canary quotidienne, mémoire d'agent qui capitalise les cas réels, itérations trimestrielles. L'agent s'améliore en opération.

→ Rapport de suivi + itérations

Les portes de décision

GO / NO-GO — trois exemples concrets

La porte GO/NO-GO est l'étape la plus rentable du processus. Elle empêche de construire sur du sable — ou de livrer un agent qui ment. Voici comment elle fonctionne en pratique.

Extraction de factures fournisseurs

Un cabinet comptable traite 2 000 factures/mois. L'extraction manuelle coûte 3 ETP.

Erreur coûteuse ? Oui — un montant erroné fausse la comptabilité
Répétitif ? Oui — même schéma sur chaque facture
Vérifiable ? Oui — chaque champ pointe un passage du PDF source

→ Trois conditions remplies. On construit.

GO CONDITIONNEL

Support client sur base documentaire

Un éditeur SaaS veut un agent qui répond aux questions des clients en citant la documentation.

Erreur coûteuse ? Oui — une fausse réponse crée un passif
Répétitif ? Oui — les mêmes questions reviennent
Vérifiable ? Partiellement — la base documentaire est incomplète

→ Condition : structurer et compléter la base documentaire d'abord. Puis on construit.

NO-GO

Brainstorming créatif pour campagne

Une agence marketing veut un agent qui génère des idées de campagne virale.

Erreur coûteuse ? Non — une mauvaise idée se filtre au tri
Répétitif ? Non — chaque brief est unique
Vérifiable ? Non — la créativité n'a pas de source de vérité

→ Un agent structuré serait du sur-engineering. Un bon prompt suffit ici. On le dit.

L'architecture

Ce que nous déployons concrètement

Chaque agent livré repose sur une arborescence standard. Pas de boîte noire — tout est lisible, versionné, et auditable par votre équipe technique.

.claude/
├── CLAUDE.md                      ← mémoire du projet (<200 lignes)
├── agents/
│   ├── parser-agent.md             ← extraction structurée
│   ├── validator-agent.md          ← confronte chaque sortie à la source
│   └── writer-agent.md             ← rédaction conforme
├── commands/
│   └── orchestrator.md             ← point d'entrée, orchestre le flux
├── skills/
│   ├── data-fetcher/
│   │   └── SKILL.md               ← récupération de données (préchargé)
│   └── output-generator/
│       └── SKILL.md               ← génération de la sortie vérifiée
├── rules/
│   └── validation.md              ← règles chargées à la demande (paths:)
├── hooks/
│   └── scripts/                   ← vérifications déterministes (lint, tests)
├── settings.json                  ← permissions, outils autorisés/bloqués
└── .mcp.json                      ← connexions doc à jour (Context7, etc.)

Le flux : Command → Agent → Skill

Un command orchestre, un agent exécute en contexte isolé avec son skill préchargé, un skill indépendant produit la sortie. Chaque composant a une responsabilité unique — comme en ingénierie logicielle.

Command

orchestre le flux

→

↓

Agent

exécute + skill préchargé

→

↓

Skill

produit la sortie vérifiée

Garde-fous déterministes

Le modèle mental

Où se trouve votre vrai levier

Les poids du modèle sont gelés et varient naturellement de ±8-14 % d'un jour à l'autre. Votre prompt ne représente qu'une fraction du contexte vu par le modèle. Vos vrais leviers sont au-dessus.

+ levier

– levier

Garde-fous déterministes

fiabilité non négociable

Boucle d'itération + vérification

votre plus gros levier

Contexte assemblé

gros levier, source des hallucinations

Votre prompt

petit levier

Poids du modèle

gelés · bruit ±8-14 %

vos vrais leviers

subi / faible levier

En résumé

De la démo au produit

Un prompt naïf produit une démo impressionnante. Notre architecture produit un système déployable — reproductible, auditable, qui échoue en sécurité plutôt que de mentir. C'est la différence entre un prototype et un produit que vos équipes utilisent en confiance.

Reproductibilité

Le même processus produit la même qualité, quelle que soit la variance du modèle.

Auditabilité

Chaque sortie est traçable à sa source. Compatible RGPD et audits internes.

Dégradation gracieuse

L'agent escalade au lieu d'inventer. Il échoue en sécurité, jamais en silence.

Contrôle des coûts

Modèle léger pour le mécanique, modèle puissant pour le jugement. Chaque token est investi.

Une stratégie initiée par Shayan Rais, validée par Boris Cherny — Créateur de Claude Code