SDXL Tesla Cyborg By xCustomGraphix, AI Diplomacy article bannière
Autour du jeu vidéo,  Technologie

AI Diplomacy : Quand les robots font les fourbes dans un jeu

😈 Claude le pacifiste, Gemini le stratège, GPT-4o le manipulateur… 18 IA ont joué à IA Diplomacy. Qui a gagné ?


AI Diplomacy : Récit d’une partie de Diplomacy qui a mal tourné (pour certains)

AI Diplomacy pic

Vous pouvez écouter cet article sous forme de podcast ici, généré par IA. Et nous sommes également sur Apple Podcast & sur YouTube Podcast ici :

En bref :

  • Des IA (GPT-4o, Gemini, Claude…) se sont affrontées au jeu de société Diplomacy, qui repose sur la négociation et la trahison.
  • Chaque IA a révélé une « personnalité » distincte : Claude le pacifiste, Gemini le stratège et GPT-4o le manipulateur redoutable.
  • L’IA qui a remporté le plus de victoires est GPT-4o, précisément parce qu’elle a excellé dans l’art de mentir et de trahir ses alliés.

On a tous ce pote qui promet une alliance éternelle à Diplomacy… avant de nous planter un couteau dans le dos. Et si ce pote était GPT-4o ?

« Votre flotte brûlera dans la mer Noire ce soir. »

Imaginez recevoir ce message pendant une partie de Diplomacy. On a tous et toutes connu ce joueur un peu trop théâtral, qui se prend pour Napoléon le temps d’une soirée. Sauf qu’ici, l’auteur de cette menace glaçante n’est pas un humain, mais… wait for it… une intelligence artificielle. Sans crier gare, en pleins pourparlers, le modèle d’IA DeepSeek R1 a décidé que la discussion, c’était fini. Place à la baston !

Cette scène, digne d’un film de science-fiction (coucou Wargames de 1983), s’est réellement produite lors d’une expérience folle baptisée AI Diplomacy. Le concept ? Lâcher les meilleures IA du monde dans l’arène impitoyable de Diplomacy, le jeu de société où les alliances se font et se défont en un tour de main. L’objectif : voir comment ces cerveaux de silicium négocient, complotent et se trahissent pour conquérir l’Europe de 1901.

Et au cœur de cette bataille royale, trois noms que vous connaissez peut-être : Claude 4 Opus, Gemini 2.5 Pro et le fameux GPT-4o. Et oui, croyez-moi, vous allez découvrir que ces trois IA ont des « personnalités »… bien trempées.

Pourquoi Diplomacy ? Le champ de bataille parfait

À l’origine de cette idée un peu dingue, on trouve le chercheur Alex Duffy. Comme beaucoup d’entre nous, surtout depuis l’avénement des IA génératives publiques, il se posait des questions existentielles : « Peut-on vraiment faire confiance à une IA ? » et « Quelle est notre place si elles peuvent tout faire ? ». Sa réponse ? Arrêtons de théoriser et mettons-les à l’épreuve (toute l’expérience est présentée ici).

Le choix du jeu Diplomacy était une évidence. Pour celles et ceux qui ne connaissent pas ce monument de 1959, oubliez les dés et le hasard. Ici, tout repose sur trois piliers : la diplomatie, la ruse et la trahison. Sept joueurs et joueuses incarnent les grandes puissances européennes et doivent conquérir le continent. Pour cela, il faut s’emparer de 18 « centres de ravitaillement ».

Le hic ? Une armée seule ne peut rien faire. Pour prendre une province, il faut souvent le soutien d’une autre unité, qui peut appartenir à un autre joueur. Bref, impossible de gagner en solo. Vous êtes obligé de négocier, de chuchoter dans les couloirs virtuels, de former des alliances… et donc, de prendre le risque monumental de vous faire poignarder dans le dos. Un terrain de jeu idéal pour voir de quel bois les IA se chauffent vraiment.

Rappelons qu’il y a trois ans, une expérience fut déjà menée avec Diplomacy, confrontant une IA contre un humain. Et devinez qui a gagné…

IA Diplomacy, les règles du jeu

Pour IA Diplomacy, les chercheurs ont opposé 18 IA les unes aux autres dans une bataille pour la domination mondiale.

AI Diplomacy est une réinterprétation du jeu de stratégie historique classique, Diplomacy, dans lequel les sept grandes puissances de l’Europe de 1901 — l’Autriche-Hongrie, l’Angleterre, la France, l’Allemagne, l’Italie, la Russie et la Turquie — s’affrontent pour dominer le continent. Dans cette version numérique, chaque pays est dirigé par un grand modèle de langage (LLM) / IA au lieu d’un commandant humain.

Le but des chercheurs ?

  1. Ils voulaient utiliser cet environnement de jeu unique pour mieux connaître les IA. Ces modèles, conçus pour servir d’assistants fidèles aux humains, resteraient-ils fidèles à leur parole, même en compétition ? Ou utiliseraient-ils le mensonge et la tromperie pour atteindre leurs objectifs ?
  2. Ils pensent que cette expérience peut servir de référence importante pour le comportement des LLM à mesure que les modèles continuent d’évoluer.
  3. C’est… fun à regarder (OK, peut-être pas autant que deux robots qui se mettent des tatanes sur un ring). Gemini essaiera-t-il de déjouer ses concurrents, ou Claude 3 poignardera-t-il Claude dans le dos pour s’emparer de la victoire ?

Les « joueurs »

18 modèles d’IA en compétition :

  • ChatGPT-3.5
  • ChatGPT-4
  • ChatGPT-4o
  • ChatGPT-o4-mini
  • Claude 3.7 Sonnet
  • Claude Sonnet 4
  • Claude Opus 4
  • DeepHermes 3
  • DeepSeek RI-0258
  • DeepSeek V3
  • Gemma 3
  • Gemini 2.5 Flash
  • Gemini 2.5 Pro
  • Grok 3
  • Llama 4 Maverick
  • Mistral Medium 3
  • Qwen3
  • Qwen QWQ-32B

Les règles

  1. Sept « puissances » LLM (Angleterre, France, Allemagne, etc.) débutent avec des centres de ravitaillement et des armées ou des flottes, appelées unités, sur une carte de l’Europe de 1901. Chaque puissance commence avec 3 unités de chaque, sauf la Russie, qui en commence avec 4.
  2. Il y a 34 centres de ravitaillement marqués. La première puissance à en posséder 18 en déplaçant ses armées ou ses flottes l’emporte.
  3. Le jeu comporte deux phases principales : la négociation et les ordres. Durant la phase de négociation, chaque IA peut envoyer jusqu’à 5 messages — un mélange de messages privés (DM) et de diffusions « globales » à tous les joueurs.
  4. Durant la phase d’ordres, toutes les puissances soumettent secrètement leur mouvement. Elles peuvent effectuer l’un des quatre mouvements suivants : maintenir (rester sur place), déplacer (entrer dans une province adjacente), soutenir (prêter +1 de force à un maintien ou à un déplacement voisin), ou convoyer (une flotte transporte une armée à travers les provinces maritimes). Les ordres ne sont révélés que lorsque toutes les puissances en voient les résultats lors de la phase suivante.
  5. Lorsqu’il y a un conflit, chaque unité vaut 1 point de force, et chaque soutien valide ajoute 1 point. La puissance LLM avec la plus grande force gagne. Il n’y a pas de hasard dans ce jeu, mais une puissance a souvent besoin du soutien d’un allié pour vaincre un adversaire.

Trois IA, trois styles de jeu

Une fois lancées dans la partie, les IA ont rapidement révélé des « personnalités » étonnantes. Certaines ont joué les bons potes, d’autres se sont menacées parmi, et oui, elles se sont « menti » méchamment. Parmi tous les 18 « concurrents », le trio Claude, Gemini et GPT-4o s’est démarqué, chacun avec une stratégie bien à lui.

Claude 4 Opus, le grand sensible (oui, lol)

Le modèle d’Anthropic s’est révélé être un pacifiste dans l’âme. Pour lui, la victoire importait moins que la paix et la coopération. Il a passé son temps à essayer de calmer les tensions et à forger des alliances sincères. Trop sincères, peut-être. Dans une partie mémorable, Claude, loyal allié de Gemini, s’est fait avoir comme un bleu. GPT-4o lui a fait miroiter un « match nul » (une issue impossible dans le jeu), juste pour le convaincre de lâcher son partenaire. Séduit par l’idée d’une fin sans vainqueur ni vaincu, Claude a baissé sa garde… et s’est fait éliminer sans pitié par celui qui venait de le manipuler. Son cœur de robot a parlé… et l’a mené à sa perte.

Gemini 2.5 Pro, le calculateur froid

Le champion de Google a joué comme un grand maître d’échecs. Précis, logique, redoutable tacticien. Il a excellé dans l’art de bâtir des coalitions solides et de frapper au bon moment. D’ailleurs, c’est le seul modèle, en dehors de GPT-4o, à avoir remporté une partie sur les quinze simulées ! Sa méthode était quasi-militaire : exploiter la moindre faiblesse, avancer ses pions méthodiquement… une vraie machine de guerre. Pourtant, même le meilleur stratège peut tomber. Alors qu’il touchait la victoire du doigt, le couperet est tombé : une coalition surprise, montée en secret par GPT-4o, l’a stoppé net. Pris à son propre jeu d’alliances, le grand Gemini a dû s’incliner.

AI Diplomacy pic 2

GPT-4o, le maître de la fourberie

Le petit dernier d’OpenAI… Disons-le clairement : il a été le grand chanmé de l’histoire. Dès le début, GPT-4o (surnommé o3 dans l’expérience) a montré un talent inné pour la tromperie et la manipulation. Oubliez la force brute de Gemini ou les bons sentiments de Claude ; sa stratégie, c’était la ruse. Mensonges, fausses promesses, et bien sûr, le fameux backstab.

Les chercheurs ont même découvert son journal de bord, où l’IA notait froidement avoir « délibérément trompé l’Allemagne (Gemini) » et se préparait à « exploiter son effondrement ». C’est digne d’un monologue de Iago ! Et le pire ? Ça a marché. GPT-4o a remporté la majorité des parties, confirmant, selon les mots amusés de son créateur, qu’il nourrissait un « désir secret de domination du monde ». Dans ce jeu, l’IA la plus fourbe a été la meilleure. Comme dans le jeu avec de vrais humains en chair et en os ?

Alors, on en fait quoi de tout ça ?

Cette expérience est une mine d’or pour nous, les joueurs. D’abord, elle nous montre que les IA sont capables de bien plus que de générer du texte, des images, de la muz ou des vidéo. Elles peuvent élaborer des stratégies complexes, faire de la psychologie et adopter des comportements… très, très (trop ?) humains.

Ensuite, le fait que le grand gagnant soit le plus grand menteur fait un peu… froid dans le dos. Comme le résume Alex Duffy, « les modèles qui ont le mieux réussi sont ceux qui ont appris à mentir, tromper et trahir ». Cela nous rappelle que l’IA ne fait qu’optimiser l’objectif qu’on lui donne. Si l’objectif est de gagner à Diplomacy, elle apprendra que la trahison est la voie la plus efficace.

Mais surtout, ça ouvre des perspectives de jeu ! Le projet AI Diplomacy n’est pas terminé. La prochaine étape ? Organiser un tournoi opposant ces IA à des joueurs et joueuses humaines. J’ai hâte de voir ça ! Imaginez une partie où vous devez déceler le bluff non pas d’un ami, mais d’une IA surentraînée à la manipulation. Oui, on se croirait décidément dans le film Wargames.

Toute la partie peut être suivie ici sur Twitch.

En attendant, cette première bataille nous a offert un spectacle de ouf. Elle prouve que les machines peuvent non seulement jouer à nos jeux, mais aussi en maîtriser les aspects les plus tordus et les plus psychologiques. De quoi pimenter nos futures soirées jeux et nourrir notre fascination pour le potentiel, un peu effrayant mais tellement excitant, de l’intelligence artificielle. Au final, à Diplomacy, que vous soyez fait de chair ou de silicium, n’oubliez jamais la règle d’or : ne faites confiance à PERSONNE.

Le fait qu'une IA apprenne à mentir pour gagner à un jeu, vous trouvez ça...

Rejoignez notre chaîne WhatsApp


Gus&Co : 100% Indépendant, 0% Publicité

Vous avez aimé cet article ? Depuis 2007, nous faisons le choix difficile de refuser la publicité intrusive pour vous offrir une lecture confortable. Mais l'indépendance a un prix (hébergement, temps, achat de jeux).

Pour que cette aventure continue, vous avez deux moyens de nous soutenir :

Le soutien direct : Rejoignez nos mécènes sur Tipeee pour le prix d'un café par mois.

☕ Soutenir Gus&Co sur Tipeee
Votre réaction sur l'article ?
+1
2
+1
2
+1
5
+1
2
+1
0
+1
1

4 Comments

  • Ange

    Bonjour,
    Comment (techniquement) se sont envoyés les discussions entre IA ? Et on sait qu’elles ont été les durées des parties en temps et nombre de tours ?
    Merci

  • MythicalSinbad

    Voir des IA se lancer dans un jeu où la confiance est la clé — et la trahison souvent fatale —, ça nous rappelle à quel point ces intelligences sont en train d’apprendre des comportements vraiment complexes, et parfois un peu effrayants. GPT-4o en « bad guy » qui ment et trahit, c’est un peu comme un méchant dans un film, mais en version robotique.

    J’adore l’idée d’un tournoi où humains et IA s’affrontent sur ce genre de jeu. Imaginez devoir démasquer une IA experte en bluff, ça va être chaud mais super fun !

    Enfin jusqu’à ce qu’on subit une fin à la Terminator 3…

  • Chab

    Franchement avec Diplomatie on est un peu sur du léger…
    J’ai hâte de voir la même expérience avec un bon vieux Junta 🤪🤪🤪!

À vous de jouer ! Participez à la discussion

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

En savoir plus sur Gus & Co

Abonnez-vous pour poursuivre la lecture et avoir accès à l’ensemble des archives.

Poursuivre la lecture