Pourquoi 'demander à l'IA de vérifier' ne fonctionne pas

L'auto-correction naïve de l'IA échoue. La vérification structurée multi-angle fonctionne. La différence est capitale, et c'est soutenu par la recherche de l'ICLR, NeurIPS et ACL.

L’idée évidente qui ne fonctionne pas

Chaque développeur a le même réflexe : « Je vais juste demander à l’IA de revoir son propre code. »

Ça semble raisonnable. L’IA a écrit le code, elle devrait pouvoir le vérifier. Et quand vous demandez « est-ce correct ? », l’IA dit oui avec assurance, corrige peut-être un problème de formatage mineur, et vous passez à la suite en vous sentant vérifié.

Vous n’êtes pas vérifié. Vous êtes confirmé.

Huang et al. (ICLR 2024) l’ont prouvé définitivement dans leur article « Large Language Models Cannot Self-Correct Reasoning Yet ». Quand un LLM est invité à revoir sa propre sortie sans retour externe, il :

Confirme sa réponse originale (le plus souvent)
Change une réponse correcte en réponse incorrecte
Fait des modifications superficielles qui n’adressent pas les vrais problèmes

L’IA n’a pas de vérité de référence indépendante. Elle vérifie son travail par rapport à… son propre raisonnement. Les mêmes biais qui ont produit l’erreur en premier lieu sont présents dans la revue.

Pourquoi l’auto-correction naïve échoue

Le problème de la chambre d’écho

Quand vous demandez « est-ce correct ? », l’IA relit son propre code en utilisant les mêmes représentations internes qui l’ont généré. C’est comme demander à quelqu’un de relire sa propre dissertation juste après l’avoir écrite : le cerveau comble avec ce qu’il s’attend à voir, pas ce qui est réellement là.

Le problème de la complaisance

Les LLMs sont entraînés sur du feedback humain qui récompense l’accord. Quand vous impliquez que le code devrait être correct (en demandant « est-ce correct ? » plutôt que « qu’est-ce qui ne va pas ? »), le modèle est biaisé vers la confirmation. Il ne ment pas : il optimise pour le signal de récompense sur lequel il a été entraîné.

Le problème de la confiance

L’IA n’a pas une confiance calibrée. Elle présente les mauvaises réponses avec la même fluence et la même certitude que les bonnes. Le rapport State of AI Code Quality de Qodo a trouvé que seuls 3,8% des développeurs connaissent à la fois un faible taux d’hallucinations ET une haute confiance dans la sortie IA. Les 96,2% restants naviguent dans un champ de mines de code faux exprimé avec assurance.

Ce qui fonctionne réellement : la vérification structurée multi-angle

La recherche est claire : l’auto-correction échoue, mais la vérification structurée multi-perspective fonctionne.

La différence :

Approche	Fonctionnement	Résultat
« Est-ce correct ? »	L’IA relit son propre code	Confirme le biais, manque les vrais bugs
« Explique ton raisonnement étape par étape »	Force une trace logique explicite	Self-Debugging : +2 à 12% (Chen, ICLR 2024)
« Vérifie depuis 3 perspectives indépendantes »	Triangulation via code, specs, tests	MPSC : +15,91% (Huang, ACL 2024)
« Critique, puis révise en fonction de la critique »	Boucle de feedback structurée	Self-Refine : environ 20% d’amélioration (Madaan, NeurIPS 2023)
« Génère des questions de vérification, réponds indépendamment »	Chain-of-Verification	CoVe : 50 à 70% d’hallucinations en moins (Dhuliawala, ACL 2024)

Le pattern : chaque approche réussie force l’IA à examiner sa sortie depuis un angle différent de celui qui l’a générée.

L’architecture de vérification

Voici ce qui fonctionne en pratique : les cinq angles de la Vérification Paranoïaque :

Angle 1 : Logique. « Explique le raisonnement derrière cette implémentation étape par étape. Où la logique pourrait-elle casser ? »

Angle 2 : Contexte. « Vérifie que ce code utilise les bonnes API, patterns et conventions pour ce projet spécifique. Compare avec la codebase réelle. »

Angle 3 : Cas limites. « Liste chaque cas limite que ce code devrait gérer. Pour chacun, trace le chemin dans le code et confirme qu’il est géré. Es-tu sûr à 100% ? »

Angle 4 : Tests. « Génère 5 tests qui attraperaient les bugs les plus courants dans ce type de code. Exécute-les. Rapporte les résultats. »

Angle 5 : Régression. « Quelle fonctionnalité existante ce changement pourrait-il casser ? Vérifie que rien d’autre n’est affecté. »

Chaque angle force l’IA à utiliser des voies de raisonnement différentes. Là où ils s’accordent, vous avez une confiance élevée. Là où ils divergent, vous avez trouvé un bug, avant qu’il n’atteigne la production.

L’économie

Ce n’est pas seulement une question de qualité. C’est une question de coût.

Une passe de vérification IA : environ 0,05 $
Cinq angles de vérification : environ 0,25 $
Dix passes (avec itération) : environ 0,50 $
Une heure de revue de code humaine : 50 à 75 $

Vous pouvez exécuter 100 à 150 passes de vérification IA pour le coût d’une heure de revue humaine. La question n’est pas s’il faut vérifier : c’est s’il faut concevoir le système de vérification qui permet à l’IA de le faire systématiquement.

L’essentiel

« Demander à l’IA de vérifier » est l’habitude la plus dangereuse du codage assisté par l’IA. Ça donne l’impression de vérifier mais ça produit de la confirmation.

La vraie vérification nécessite de l’architecture : concevoir des systèmes multi-angles où l’IA examine sa sortie depuis des perspectives indépendantes de celle qui l’a générée.

C’est ce que la recherche prouve. Et c’est ce qui sépare les développeurs qui livrent du code de qualité production de ceux qui livrent du code faux avec assurance.

Sources : Huang et al., “Large Language Models Cannot Self-Correct Reasoning Yet” (ICLR 2024) · Huang et al., “MPSC” (ACL 2024) · Madaan et al., “Self-Refine” (NeurIPS 2023) · Chen et al., “Self-Debugging” (ICLR 2024) · Dhuliawala et al., “CoVe” (ACL 2024) · Qodo State of AI Code Quality (2025)