Uma IA chamada Cicero pode derrotar humanos em Diplomacy, um complexo jogo de construção de alianças

Em raras boas notícias da Meta, os pesquisadores de inteligência artificial da empresa acabam de anunciar um avanço científico. Seu programa de IA chamado Cicero agora pode jogar o jogo de tabuleiro Diplomacia em um nível humano.

Agora, antes que você fique muito animado, Cícero não joga em um nível sobre-humano. Ele foi derrotado por cerca de 10% dos humanos contra quem jogou. Em comparação, nos estágios anteriores da IA, como a IA derrotando humanos no xadrez ou no Go, os humanos há muito foram completamente superados.

A IA Go-playing da DeepMind é, por exemplo, um “go god” – de acordo com o grande mestre chinês Ke Jie. Mesmo o campeão mundial de go humano perderia agora 100-0 para o computador.

Diplomacia é um jogo simplificado e abstrato, envolvendo exércitos e marinhas rivais invadindo ou não os territórios uns dos outros. É justo dizer que lhe falta a complexidade e a sutileza do tipo de diplomacia empreendida nos salões das Nações Unidas.

No entanto, a notícia do desempenho de Cícero estava na mira de rivais de tecnologia como o Google, dono da DeepMind. O CEO e fundador da DeepMind, Demis Hassabis, é um especialista em diplomacia. Ele ganhou o World Tag Team Championship em 2004 e terminou em 4º no mundo no World Championship de 2006.

Espero que o Hassabis vença facilmente o Cícero devido a algumas das limitações que irei apontar em breve.

O jogo da diplomacia

Diplomacia é o que os pesquisadores de IA chamam de “jogo determinístico de sete jogadores, soma zero e informações imperfeitas”. Um jogo de sete jogadores é muito mais difícil de resolver do que um jogo de dois jogadores como xadrez ou go. Você deve considerar as muitas estratégias possíveis de não um, mas seis outros jogadores. Isso torna muito mais difícil escrever uma IA para jogar.

A diplomacia também é um jogo de informações imperfeitas, pois os jogadores fazem movimentos simultaneamente. Ao contrário de jogos como xadrez ou go, onde você sabe tudo sobre os movimentos de seu oponente, os jogadores de Diplomacy fazem movimentos sem saber o que seus oponentes estão prestes a fazer. Eles devem, portanto, prever as próximas ações de seus oponentes. Também aumenta o desafio de escrever uma IA para jogá-lo.


Este gráfico de Diplomacia Digital mostra os vários territórios terrestres e marítimos que os jogadores devem atravessar. Wikimedia Commons

Por fim, a Diplomacia é um jogo de soma zero em que, se você ganhar, eu perco. E o resultado é determinístico e não depende do acaso. No entanto, antes da vitória ou derrota, sempre vale a pena os jogadores formarem alianças e se unirem uns aos outros. De fato, um dos verdadeiros desafios do jogo é administrar as negociações informais com os outros jogadores antes de fazer movimentos simultâneos.

A principal razão pela qual o desempenho de Cícero é um avanço científico é que ele pode jogar bem o jogo e realizar essas negociações informais. Essa combinação de processamento de linguagem natural e raciocínio estratégico é inédita em qualquer IA de jogos.

Derrote Cícero

Uma leitura atenta de Meta artigo publicado sobre Cícero na prestigiosa revista Science oferece algumas pistas sobre como você pode vencê-lo.

Primeiro, Cícero é quase totalmente honesto (ao contrário do famoso romano leva o seu nome). Por outro lado, a Diplomacia é um jogo de traição e desonestidade. Os jogadores se oferecem para formar alianças, mas muitas vezes perdem esses acordos instantaneamente. Cícero não. Sempre joga direto.

A honestidade é uma estratégia surpreendentemente eficaz na diplomacia, mas não se seus oponentes souberem que você nunca os trairá. Esse é o problema. Cícero jogou anonimamente, então seus oponentes humanos provavelmente não teriam resolvido esse problema. Mas se você conhece esse fato, será fácil aproveitá-lo.

Em segundo lugar, Cícero (desta vez como seu homônimo) é muito falador. Jogadores especialistas em diplomacia trocam duas vezes mais mensagens com outros jogadores do que jogadores não especialistas. O truque é formar alianças e tranquilizar seus oponentes sobre sua intenção. Cícero também troca duas vezes mais mensagens do que os jogadores humanos que ele tende a derrotar.

Claro, sendo um bot, é muito mais fácil para Cícero gerenciar seis conversas simultâneas. E isso, eu diria, é uma vantagem injusta de ser um computador neste cenário.

E depois ?

Não está claro como a Meta pretende desenvolver essa pesquisa. Um computador capaz de raciocinar sobre as crenças, objetivos e intenções dos outros, bem como persuadir e construir relacionamentos por meio do diálogo, é uma ferramenta poderosa. É um que poderia facilmente ser mal utilizado. Não esqueçamos que, há vários anos, o Facebook (propriedade da Meta) recebeu muitas críticas justificadas por uma experiência destinada a manipular as emoções do usuário.

Ainda assim, é difícil dizer exatamente quais seriam as aplicações reais de Cícero. Afinal, a diplomacia do mundo real não é de soma zero nem determinística. Dois países podem concordar em não entrar em guerra e ambos vencerão.

Depois, há uma série de fatores aleatórios que podem alterar um resultado. A Armada Espanhola, por exemplo, perdeu mais navios para inesperadas tempestades de verão do que para o fogo inimigo.

Quaisquer que sejam as intenções da Meta, o avanço é outro exemplo de como as grandes empresas de tecnologia estão assumindo o controle da corrida da IA ​​com investimentos bilionários que não podem ser igualados pelo público da indústria. Cicero foi produzido por uma equipe de mais de 25 pesquisadores. Ninguém trabalhando em uma universidade tem esse tipo de recurso para resolver um jogo de tabuleiro.

Como pesquisador de inteligência artificial em uma dessas universidades, estou em conflito. Lembro-me de um grafite famoso em Pompéia quem disse

Suti Ciciiro vapla novamente

“Você vai amar Cícero, ou será chicoteado”.

A conversa

Toby Walsh recebe financiamento do Australian Research Council como ARC Laureate Scholar.

/ Cortesia de The Conversation. Este material da organização/autores originais pode ser de natureza ad hoc, editado para maior clareza, estilo e extensão. As opiniões e opiniões expressas são de responsabilidade dos autores.