L'écart de perception de 43 points : pourquoi l'IA vous donne l'impression d'aller vite alors qu'elle vous ralentit

Les développeurs pensent que l'IA les rend 24% plus rapides. Ils sont en réalité 19% plus lents. C'est un écart de 43 points entre perception et réalité, et cela explique tout ce qui ne va pas avec le vibe coding.

L’étude qui devrait vous inquiéter

En 2025, METR a publié un essai contrôlé randomisé. Pas un sondage, pas des opinions : une véritable expérience, avec 16 développeurs open-source expérimentés réalisant 246 tâches réelles sur leurs propres repositories.

Les résultats :

Les développeurs croyaient que l’IA les rendait 24% plus rapides
Ils étaient en réalité 19% plus lents
C’est un écart de 43 points entre perception et réalité

Relisez cela. Les développeurs qui se sentaient les plus productifs avec l’IA étaient mesurablement moins productifs. Et ce n’étaient pas des juniors : c’étaient des contributeurs expérimentés travaillant sur des codebases qu’ils connaissaient bien.

Pourquoi l’écart existe

L’écart de perception a trois causes, toutes documentées en sciences cognitives :

1. L’illusion de vitesse

L’IA génère du code instantanément. Regarder les tokens défiler donne une impression de productivité. Votre cerveau enregistre « la sortie apparaît vite » comme « le travail avance vite ».

Mais la génération n’est pas le goulot d’étranglement. Comprendre, vérifier et intégrer la sortie de l’IA l’est. L’étude METR a trouvé que le temps économisé sur l’écriture était perdu à déboguer de la sortie IA non vérifiée.

2. Le biais d’automatisation

Parasuraman & Manzey (2010) ont documenté le biais d’automatisation en détail : les humains font systématiquement trop confiance aux systèmes automatisés. Quand l’IA génère du code d’apparence plausible, le pattern matching de votre cerveau dit « ça a l’air correct », et l’impulsion de vérification s’affaiblit.

Les données de Sonar confirment ceci : 96% des développeurs ne font pas entièrement confiance au code IA, mais seulement 48% le vérifient toujours. La moitié des développeurs acceptent du code qu’ils savent potentiellement faux.

3. La variante Dunning-Kruger

Il existe une version spéciale du Dunning-Kruger pour le codage IA : les développeurs qui utilisent le plus l’IA sont les plus confiants dans sa sortie, tout en étant les moins susceptibles de détecter ses erreurs. Pourquoi ? Parce que les utilisateurs intensifs d’IA ont moins de pratique à lire et comprendre le code manuellement.

L’étude d’Anthropic de 2026 a quantifié ceci : les développeurs utilisant l’IA sans restrictions ont obtenu 17% de moins aux tests de compréhension. Dans une tâche de maintenance simulant une « panne IA », les utilisateurs sans restrictions avaient un taux d’échec de 77% contre 39% pour les utilisateurs encadrés.

Les données cumulées

Le résultat de METR n’est pas isolé. Voici ce que montrent les données globales :

Métrique	Source	Résultat
Temps de revue des PR	DORA 2025	En hausse de 91% avec l’adoption de l’IA
Taille des PR	DORA 2025	En hausse de 154% avec l’adoption de l’IA
Taux de bugs	DORA 2025	En hausse de 9% avec l’adoption de l’IA
Taux d’échec des changements	DORA 2025	En hausse d’environ 30% avec l’adoption de l’IA
Temps passé à vérifier la sortie IA	Sonar 2026	24% de la semaine de travail
Problèmes majeurs dans le code IA	CodeRabbit 2025	1,7x plus que le code humain
Risque de défauts dans le code de mauvaise qualité	CodeScene 2025	En hausse de 30% avec l’IA

Le pattern est clair : l’IA augmente le volume de sortie tout en diminuant la qualité de sortie. L’effet net sur la productivité réelle est négatif, sauf si vous avez un système de vérification.

Ce que l’écart signifie

L’écart de perception de 43 points explique pourquoi l’industrie est bloquée :

Les entreprises pensent que l’IA fonctionne parce que les développeurs déclarent se sentir plus productifs. Mais les métriques racontent une autre histoire : plus de code, plus de bugs, plus de temps de revue, plus d’échecs.

Les développeurs pensent qu’ils deviennent meilleurs avec l’IA parce qu’ils génèrent plus de code plus vite. Mais ils deviennent moins bons dans ce qui compte : savoir quand le code est faux.

Les programmes de formation enseignent la mauvaise chose parce qu’ils se concentrent sur la génération (prompting, usage des outils) au lieu de la vérification (vérification, validation, preuve de correction).

Combler l’écart

L’écart se comble quand vous arrêtez de mesurer la vitesse et commencez à mesurer la correction.

Les développeurs de l’étude METR qui étaient les plus rapides n’étaient pas ceux qui généraient le plus de code. C’étaient ceux qui vérifiaient systématiquement, détectant les erreurs en minutes au lieu de les déboguer pendant des heures.

C’est toute la prémisse de la Vérification Paranoïaque : concevoir des systèmes où l’IA prouve la correction de sa propre sortie depuis plusieurs angles, pour que vous passiez moins de temps à déboguer et plus de temps à livrer du code vérifié.

L’écart de perception est l’angle mort du marché. Et c’est exactement là que réside l’opportunité.

Sources : METR Randomized Controlled Trial (2025, 16 devs, 246 tasks) · Sonar State of AI Code Quality (2026, 1,100+ devs) · DORA Accelerate State of DevOps (2025) · CodeRabbit AI Code Quality Report (2025, 470 PRs) · Anthropic Research: AI Assistance & Coding Skills (2026) · CodeScene AI Code Defect Study (2025, peer-reviewed)