Une étude de l’UC Berkeley montre que l’IA fait grimper les notes
D'après The Decoder (21 juin 2026 à 14h01)
Résumé
Une étude de l’UC Berkeley sur plus de 500 000 notes révèle une hausse marquée des résultats dans les cours à forte part d’écrit et de code depuis ChatGPT.
Les faits
Une nouvelle étude de l’UC Berkeley, menée dans une « grande université publique de recherche sélective » au Texas, a analysé plus de 500 000 notes sur huit semestres d’automne, de 2018 à 2025, couvrant 319 cours dans 84 départements. Elle montre que les cours comportant une forte proportion de devoirs d’écriture et de programmation voient leurs notes augmenter nettement depuis le lancement de ChatGPT en novembre 2022. Dans ces cours fortement exposés à l’IA, la part de notes A a bondi de 13 points de pourcentage, soit environ 30 % au‑dessus du niveau de référence 2022. La moyenne générale (GPA) a progressé de 0,12 point et la distribution des notes s’est resserrée, avec des A‑ et B+ qui sont désormais reclassés en A. L’exposition d’un cours à l’IA est mesurée à partir de la part d’écrit et de code dans les plans de cours de l’automne 2022, avant l’arrivée de ChatGPT, c’est‑à‑dire dans les domaines où les modèles génératifs sont les plus performants. Pour déterminer si ces hausses reflètent de véritables gains d’apprentissage ou un travail délégué à l’IA, le chercheur Igor Chirikov a examiné le poids des devoirs dans la note finale. Si l’IA améliorait réellement les compétences, les augmentations devraient apparaître quel que soit l’équilibre entre devoirs à la maison et examens surveillés. À l’inverse, si l’IA remplace le travail des étudiants sur les devoirs non supervisés, l’effet devrait se concentrer dans les cours où ces devoirs comptent davantage. Les données confirment ce second scénario : dans les cours où les devoirs représentent plus que la part médiane de la note, la proportion de A augmente de 16 points de pourcentage supplémentaires par rapport aux cours en dessous de cette médiane mais ayant la même exposition à l’IA. Dans ces cours moins centrés sur les devoirs, l’effet est faible et non statistiquement significatif. Chirikov estime que ce résultat est « difficile à concilier avec de larges gains d’apprentissage ou des effets de tri à eux seuls ». Un test placebo renforce cette conclusion : dans le cas des exposés oraux, où l’IA est beaucoup moins utile, les notes ne bougent pas.
Pourquoi c’est important
Cette étude suggère que l’essor de l’IA générative pourrait éroder la capacité des notes universitaires à refléter réellement le niveau d’apprentissage des étudiants. Le fait que les hausses se concentrent sur les devoirs à la maison, dans les matières où l’IA est la plus performante, indique un phénomène de sous‑traitance du travail plutôt qu’une montée globale des compétences. Pour les établissements d’enseignement supérieur, ces résultats posent des questions stratégiques sur la conception des évaluations, l’équilibre entre devoirs et examens surveillés, et la fiabilité des GPA comme signal pour les employeurs et les écoles graduées. Ils alimentent aussi le débat sur la nécessité d’adapter les politiques académiques et les outils de contrôle dans un environnement où l’IA peut aisément se substituer au travail étudiant.
Questions fréquentes
Que montre l’étude de l’UC Berkeley sur l’impact de l’IA sur les notes ?
Elle montre une forte hausse des notes dans les cours avec beaucoup d’écriture et de code depuis le lancement de ChatGPT.
Quelle ampleur de hausse des notes A est observée ?
La part de notes A a augmenté de 13 points de pourcentage, soit environ 30 % au‑dessus du niveau de référence de 2022.
Pourquoi les devoirs jouent‑ils un rôle central dans les résultats ?
Les hausses se concentrent dans les cours où les devoirs comptent plus que la médiane, ce qui suggère un recours accru à l’IA sur ces travaux.
Que constate l’étude pour les exposés oraux ?
Pour les exposés oraux, où l’IA est moins utile, les notes ne changent pas selon le test placebo.
Que conclut le chercheur Igor Chirikov sur ces hausses de notes ?
Il juger ces résultats difficiles à concilier avec de simples gains d’apprentissage ou des effets de tri.
Source
The DecoderAuteur
Rédaction IA-MediasRédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.