OpenAI mesure enfin si GPT-5 peut remplacer l’humain dans certaines tâches

Image d'illustration. OpenAIOpenAI / PR-ADN
Avec GDPval, OpenAI teste GPT-5 sur des tâches concrètes issues de 44 professions.
Tl;dr
- OpenAI lance GDPval, un référentiel pour mesurer les capacités de GPT-5 face à des professionnels dans 44 métiers et 9 industries.
- Le test repose sur 1320 tâches concrètes validées par des experts, allant du droit à la santé en passant par le journalisme et la finance.
- Les résultats montrent que GPT-5 s’approche du niveau humain, mais certaines subtilités restent difficiles et l’IA transformera progressivement le monde du travail.
Un nouveau standard d’évaluation pour l’intelligence artificielle
À l’heure où la course à l’intelligence artificielle généralisée (AGI) s’intensifie, OpenAI, pionnière dans ce domaine, vient de dévoiler un outil inédit pour jauger la performance de ses modèles. Baptisé GDPval, ce référentiel ambitionne de mesurer l’écart – ou la proximité – entre les capacités de ChatGPT (dans sa version GPT-5) et celles de véritables professionnels issus d’une multitude de secteurs.
Des tâches professionnelles au cœur du test
Contrairement aux tests académiques classiques souvent critiqués pour leur manque de réalisme, le dispositif imaginé par OpenAI se veut résolument ancré dans la vie professionnelle. Les concepteurs du GDPval ont ainsi réuni pas moins de 1 320 tâches spécialisées, conçues et validées par des experts affichant en moyenne quatorze années d’expérience dans leur métier. Chacune s’inspire de productions concrètes — dossier juridique, plan de soins infirmiers, devis technique ou encore analyse financière.
La diversité est frappante : en tout, le benchmark couvre 44 métiers distincts, répartis dans neuf industries allant du journalisme à l’ingénierie, en passant par le management, le secteur médical ou les services administratifs. Pour donner une idée plus précise, voici quelques-uns des domaines explorés :
- Santé : infirmiers diplômés d’État, gestionnaires de services médicaux…
- Médias : journalistes, monteurs vidéo, techniciens audiovisuel…
- Droit et finance : avocats, auditeurs, analystes financiers…
L’IA rivalise-t-elle déjà avec les humains ?
Les premiers retours publiés par OpenAI sont sans ambiguïté : selon la société, le modèle GPT-5, tout comme son concurrent Claude Opus 4.1 développé par Anthropic, « s’approche déjà du niveau des experts du secteur ». Toutefois – prudence oblige – ces résultats restent à nuancer. D’une part parce que l’évaluation actuelle ne porte que sur des réponses uniques (« one-shot ») et non sur des tâches nécessitant plusieurs itérations ou un contexte approfondi. D’autre part car, malgré des progrès indéniables, les modèles peinent encore sur certaines subtilités inhérentes au monde réel.
Avenir du travail : mutation inévitable mais contrôlée ?
Impossible aujourd’hui d’ignorer que l’arrivée massive de l’IA, capable d’accomplir des missions autrefois réservées à l’humain, va transformer notre rapport au travail. Si une part croissante d’activités pourra être automatisée ou déléguée à la machine, il subsistera toujours une place — différente certes — pour la créativité et le discernement humains. Comme le souligne la communication officielle : « Ceci n’est qu’un premier pas ; les futurs tests intègreront davantage d’interactivité et mieux refléteront la complexité réelle du travail intellectuel. »
En définitive, si beaucoup s’inquiètent pour leur emploi face à cette révolution annoncée par l’AGI, il est permis de penser que notre capacité d’adaptation pèsera tout autant que la technologie elle-même dans la façon dont nous traverserons ce tournant décisif.