Home Sciences et technologiesIA générative : un échec aux épreuves exigeantes de l’ENS en 2026

IA générative : un échec aux épreuves exigeantes de l’ENS en 2026

by Louis Girard - Tech
Un test rigoureux pour l’IA générative : les limites révélées par un concours d’élite

Le 15 mai 2026, le chercheur en informatique David Monniaux publie une analyse critique sur les performances réelles des outils d’IA générative lors d’un concours d’entrée à l’École normale supérieure (ENS), révélant leurs limites face à des épreuves exigeant une rigueur méthodique et une compréhension approfondie.

Un test rigoureux pour l’IA générative : les limites révélées par un concours d’élite

Les outils d’intelligence artificielle générative, souvent présentés comme des révolutionnaires dans l’éducation et la recherche, ont été soumis à un test sans concession : le concours d’entrée à l’École normale supérieure (ENS). Dans un billet publié le 15 mai 2026 sur *Mediapart*, David Monniaux, chercheur en informatique à l’INRIA, tire les conclusions d’une expérience où une IA générative a tenté de résoudre un énoncé de concours particulièrement complexe. Résultat : malgré des progrès indéniables, les systèmes actuels peinent encore à reproduire la finesse analytique et la créativité exigées par les jurys des grandes écoles.

Monniaux insiste sur un point clé : son objectif n’est pas de promouvoir ou de critiquer ces technologies, mais d’en évaluer les capacités réelles, sans biais commercial ou idéologique. Ses recherches, centrées sur la vérification formelle des logiciels, le placent en position d’observateur exigeant. Le billet s’inscrit dans une série où il teste l’IA sur des épreuves académiques, après avoir déjà analysé ses performances dans un commentaire historique.

L’IA face à un énoncé de concours : entre promesses et lacunes

L’expérience décrite par Monniaux repose sur un énoncé fourni sous forme de PDF scanné – un format volontairement difficile pour simuler les conditions réelles d’un concours. L’IA a été sollicitée pour répondre à ce problème, d’abord sous forme brute, puis sous forme de fichier LaTeX, un format plus structuré. Les résultats, bien que non quantifiés précisément dans le billet, soulignent des faiblesses structurelles :

Les outils d’IA générative montrent des difficultés à manipuler des données complexes, à enchaîner des raisonnements logiques sur plusieurs étapes, et à produire des réponses aussi précises que celles attendues dans un contexte académique exigeant.

David Monniaux, chercheur en informatique (INRIA)

Monniaux souligne que ces lacunes ne sont pas surprenantes : les IA génératives excellent dans la synthèse d’informations et la génération de texte, mais restent limitées face à des tâches nécessitant une compréhension profonde des mécanismes sous-jacents. Le concours de l’ENS, réputé pour son exigence en mathématiques, physique ou philosophie, illustre cette limite. Par exemple, un problème de mathématiques pourrait exiger non seulement des calculs, mais aussi une interprétation fine des hypothèses et une justification rigoureuse – des compétences où l’IA peine encore à rivaliser avec un candidat humain.

Le chercheur précise que son analyse ne cible pas une technologie en particulier. Je ne mentionne pas de noms de services, écrit-il, pour éviter toute confusion avec des débats marketing ou des rivalités entre acteurs comme OpenAI, Mistral AI ou Anthropic. Son approche est délibérément neutre, fondée sur des tests concrets plutôt que sur des promesses publicitaires.

Un débat qui dépasse la seule question technologique

Au-delà des performances techniques, le billet de Monniaux ouvre une réflexion plus large sur l’intégration des IA dans l’éducation. Plusieurs enjeux émergent :

  1. L’évaluation de la créativité : Les concours comme celui de l’ENS valorisent la capacité à innover, à proposer des solutions originales ou à argumenter avec subtilité. Or, les IA génératives reproduisent des schémas existants plutôt qu’elles n’inventent. Elles excellent à combiner des idées, mais pas à en générer de nouvelles dans un cadre strictement défini, note Monniaux.
  2. La rigueur méthodologique : Un candidat humain peut corriger ses erreurs en temps réel, tandis qu’une IA, même fine-tunée, peut produire des réponses incohérentes sans toujours le signaler. Dans un concours, où chaque détail compte, ce risque est inacceptable.
  3. L’éthique de l’usage : Monniaux évite de trancher sur la question de savoir si ces outils devraient être autorisés lors des épreuves. Son constat reste factuel : Je ne suis pas rémunéré par une entreprise d’IA, et mes recherches ne portent pas sur ce sujet. Pourtant, son analyse pourrait alimenter le débat sur la régulation des outils assistés par IA dans les examens.

Son billet, publié sur un blog personnel, n’a pas la prétention d’une étude scientifique. Je n’ai ni le temps, ni les moyens, ni les compétences pour réaliser des recherches en sciences de l’éducation, rappelle-t-il. Pourtant, son approche méthodique et son refus des généralités en font un document précieux pour les enseignants, les chercheurs et les décideurs.

Quelles perspectives pour l’IA dans l’enseignement supérieur ?

Si les résultats de Monniaux ne sont pas une surprise pour les spécialistes, ils confirment une tendance déjà observée : les IA génératives sont des amplificateurs de productivité plutôt que des remplaçants de l’expertise humaine. Plusieurs pistes se dessinent pour leur intégration future dans l’enseignement supérieur :

Quelles perspectives pour l’IA dans l’enseignement supérieur ?
Quelles perspectives pour l’IA dans l’enseignement supérieur
  1. Un outil d’assistance, non de substitution : Les institutions pourraient les utiliser pour générer des ébauches de réponses, des plans de travail ou des simulations, tout en maintenant un contrôle humain sur les évaluations finales.
  2. L’adaptation des épreuves : Des concours pourraient évoluer vers des formats où la créativité et l’analyse critique sont évaluées de manière plus directe, là où les IA peinent encore.
  3. La formation des enseignants : Comme le souligne Monniaux, comprendre les limites de ces outils est aussi important que leurs avantages. Une prise de conscience collective est nécessaire pour éviter une dépendance mal maîtrisée.

Reste une question ouverte : jusqu’où les IA génératives pourront-elles progresser avant de pouvoir prétendre à une équivalence avec un candidat humain dans des épreuves d’excellence ? Pour l’instant, les réponses restent dans le domaine de la spéculation. Ce que l’expérience de Monniaux démontre, c’est que la route est encore longue – et que la prudence s’impose.

Pourquoi ce test est-il significatif ?

Le concours de l’ENS n’est pas un cas isolé. D’autres institutions, comme les grandes écoles d’ingénieurs ou les universités américaines, commencent à s’interroger sur l’impact des IA dans leurs processus de sélection. Plusieurs éléments rendent l’analyse de Monniaux particulièrement pertinente :

  • Un benchmark exigeant : L’ENS est une référence en matière d’exigence académique en France. Ses épreuves, souvent considérées comme parmi les plus difficiles au monde, servent de test grandeur nature pour évaluer les capacités des IA.
  • Une approche dénuée de parti pris : Contrairement à de nombreux débats médiatiques, souvent biaisés par des enjeux commerciaux ou idéologiques, Monniaux adopte une posture strictement technique. Son billet évite ainsi les écueils des polémiques stériles.
  • Un signal pour les chercheurs : Ses conclusions pourraient inciter les équipes travaillant sur les IA génératives à se concentrer sur des axes spécifiques, comme l’amélioration de la compréhension contextuelle ou la gestion des incertitudes dans les réponses.

Enfin, son travail rappelle que l’innovation technologique ne doit pas se faire au détriment de la rigueur scientifique. Dans un domaine où les promesses dépassent souvent les réalisations, des analyses comme celle de Monniaux sont indispensables pour éviter les illusions.

Et demain ? Les prochaines étapes pour l’IA éducative

Si les IA génératives ne sont pas encore prêtes à remplacer les candidats dans des concours d’élite, plusieurs évolutions pourraient changer la donne dans les prochaines années :

  • L’amélioration des modèles multimodaux : Les systèmes capables de traiter à la fois du texte, des images et des données structurées (comme les PDF scannés utilisés par Monniaux) pourraient réduire certaines lacunes. Des acteurs comme Mistral AI ou Google DeepMind explorent déjà cette voie.
  • Le développement de l’IA “explicable” : Des modèles plus transparents, capables de justifier leurs réponses étape par étape, pourraient gagner en crédibilité auprès des jurys académiques. Des travaux en cours dans le domaine de l’explainable AI (XAI) pourraient y contribuer.
  • L’hybridation homme-machine : Plutôt que de chercher à remplacer les experts, les institutions pourraient imaginer des formats où l’IA assiste les candidats ou les correcteurs, sans prendre le relais total. Par exemple, en générant des contre-exemples pour tester la robustesse des raisonnements.

Pour l’instant, cependant, les conclusions de Monniaux restent valables : Les IA génératives sont des outils puissants, mais leur usage dans l’éducation doit être encadré par une compréhension claire de leurs limites. Dans un contexte où la pression pour intégrer ces technologies est forte, son analyse offre une bouffée d’air réaliste.

Une chose est sûre : le débat est loin d’être clos. Entre les promesses des éditeurs, les craintes des enseignants et les attentes des étudiants, l’IA générative dans l’enseignement supérieur reste un sujet où la prudence doit primer sur l’enthousiasme.

You may also like

Leave a Comment

This site uses Akismet to reduce spam. Learn how your comment data is processed.