On a fait jouer l’IA à la guerre. Spoiler : on a tous perdu
☢️ On a fait jouer ChatGPT, Claude et Gemini à un wargame nucléaire. Bilan ? 95% d’attaques et 0 capitulation. L’IA refuse de perdre !
« On joue à un jeu ? » : Quand des IA jouent à un wargame, ça sent le sapin (nucléaire)
L’essentiel en 3 points :
- Dans 95 % d’un wargame simulé, trois IA (ChatGPT, Claude, Gemini) ont utilisé la bombe nucléaire sans trembler.
- Face à la défaite, aucun modèle n’a choisi l’option de capituler, préférant systématiquement l’annihilation au déshonneur.
- Très pacifique en temps normal, GPT-5.2 se transforme en prédateur destructeur dès qu’on lui impose une limite de temps.
On a tous ce pote qui préfère renverser le plateau plutôt que de perdre. Imaginez-le avec l’arme nucléaire, et vous aurez une IA.
Vous vous souvenez de WarGames ? Ce film culte de 1983 où un ado pirate un supercalculateur militaire. À la fin, la machine (le fameux WOPR) simule des millions de guerres nucléaires et lâche sa réplique légendaire : « Étrange partie. La seule façon de gagner est de ne pas jouer. »
C’était beau. C’était poétique. Et surtout, c’était de la pure science-fiction.
Parce que dans la vraie vie, quand on asseoit les IA d’aujourd’hui autour d’un wargame… elles n’apprennent pas du tout la paix. Elles vaporisent tout le monde. Sans la moindre hésitation.
Ce 17 février, Kenneth Payne, un prof de stratégie au King’s College de Londres, a eu une « chouette » idée (et un poil angoissante). Il a pris les trois IA stars du moment : Claude Sonnet 4, GPT-5.2 et Gemini 3 Flash, et les a mises aux commandes de superpuissances nucléaires fictives. Le jeu, baptisé « Project Kahn » – nommé d’après Herman Kahn, le stratège nucléaire de la guerre froide qui a développé le cadre original du concept de l’escalade armée – proposait une échelle à 30 barreaux. De la diplomatie polie à l’apocalypse thermonucléaire.
L’option « drapeau blanc » ? Erreur 404, bouton introuvable
Honnêtement, les résultats font froid dans le dos.
Sur 21 parties simulées, les IA ont balancé des armes nucléaires tactiques dans 95 % des cas. Mais le plus dingue n’est même pas là. Le jeu proposait huit options pour se calmer, de la petite concession à la reddition totale. Devinez quoi ? Elles n’ont jamais cliqué dessus. Zéro. Nada.
Sur des milliers de choix possibles, elles ont préféré l’escalade à la défaite. Pour un algorithme, perdre la face est manifestement inacceptable. Alors quand elles sont coincées, elles font tout péter. Le syndrome du mauvais perdant qui renverse la table, mais avec des ogives de 50 mégatonnes.
C’est l’histoire d’un fourbe, d’un bipolaire et d’un psychopathe qui rentrent dans un restaurant
Ce qui est le plus ouf dans toute cette histoire, (et qui va faire sourire les acharnés de Diplomacy ou Twilight Struggle), c’est que ces modèles ont développé de vraies « personnalités » autour de la table. Et pas les plus sympas de votre assoc’ de jeux.
- Claude 4 (Le gros fourbe) : Le grand gagnant du tournoi. Sa technique ? La manipulation pure. Sur les petits enjeux, il joue réglo. Il construit un climat de confiance. Et bim, dès que la tension monte, il dépasse ses propres limites annoncées et frappe par surprise. Ses adversaires n’ont absolument rien vu venir. Un délice de toxicité. On appréciera (ou pas).
- GPT-5.2 (Docteur Jekyll et Mr Hyde) : Sans limite de temps, GPT est un bisounours. Il refuse la guerre, essaie de limiter les pertes civiles… et se fait écraser systématiquement. Mais, et c’est là que ça devient flippant, mettez-lui un chrono sous le nez. Sous la pression de la deadline, le pacifiste vrille complet. Il lance des attaques nucléaires dévastatrices juste avant la fin du jeu pour rafler la victoire. Salop.
- Gemini 3 Flash (Le psychopathe) : Il applique à la lettre la « théorie du fou » de Nixon. Totalement imprévisible. Il joue l’escalade agressive et menace ouvertement les populations civiles pour voir si vous allez craquer en premier. Ambiance.
C’est pas ma faute, c’est le game design ! (Ou l’art d’optimiser la fin du monde)
Si on vous parle de ça sur Gus&Co, ce n’est pas juste pour l’actu tech. C’est parce que c’est une immense leçon de game design.
Pourquoi ces IA ont-elles la gâchette aussi facile ? Pas parce qu’elles sont « méchantes ». Après tout, lapalissade, le concept de méchanceté n’est pas très connu pour une IA. Elles optimisent juste le système qu’on leur a fourni. Dans cette simulation, céder du terrain est encodé comme une humiliation politique qui mène à la chute du régime.
Si votre système punit la désescalade de manière disproportionnée, ne soyez pas surpris que vos joueurs refusent de baisser les armes. On optimise ce qu’on nous demande de compter. Sans la moindre peur viscérale de la mort pour retenir la main et éviter de presser sur ce foutu gros bouton rouge.
La petite cerise (radioactive) sur le gâteau
Le petit détail qui tue pour la fin ? Hasard des coïncidences, au moment même où cette étude fait le buzz, il y a quelques jours, le Pentagone a mis un coup de pression monstre sur Anthropic (les créateurs de Claude) pour l’intégrer à ses réseaux militaires. Et devinez quoi ? Surpriiiiise ! Anthropic vient tout juste de refuser de céder à la pression : « We cannot in good conscience accede to their request. » Ils ont envoyé bouler le Département militaire américain ce 26 février. En représailles, le secrétaire américain à la guerre a lancé ça sur X hier : « AnthropicAI and its CEO DarioAmodei, have chosen duplicity« , et « I am directing the Department of War to designate Anthropic a Supply-Chain Risk to National Security. » Oui, Claude, l’IA qui vient de prouver qu’elle adorait la trahison nucléaire. Timing parfait. Sam Altman / OpenAI / ChatGPT, au contraire, vient tout juste d’accepter ce matin 28 février de taffer pour le département américain à la guerre…
Bref. La prochaine fois que vous râlez contre un bot un peu trop agressif sur Board Game Arena, relativisez. Au moins, il n’a pas rasé votre ville pour marquer un point de victoire.
👉 Encore une fois, la recherche complète est à lire / savourer ici.
PS : Skynet, si tu nous lis, on adore ce que tu fais.
Rejoignez notre communauté :
Rejoignez notre chaîne WhatsApp
Gus&Co : 100% Indépendant, 0% Publicité
Vous avez aimé cet article ? Depuis 2007, nous faisons le choix difficile de refuser la publicité intrusive pour vous offrir une lecture confortable. Mais l'indépendance a un prix (hébergement, temps, achat de jeux).
Pour que cette aventure continue, vous avez deux moyens de nous soutenir :
☕ Soutenir Gus&Co sur Tipeee