IA da Uber bate recorde e é a primeira a dominar jogos clássicos de Atari

Por Felipe Autran

28/11/2018 - 13:552 min de leitura

IA da Uber bate recorde e é a primeira a dominar jogos clássicos de Atari

Fonte:

Imagem de IA da Uber bate recorde e é a primeira a dominar jogos clássicos de Atari no tecmundo

Pela primeira vez na história, uma inteligência artificial (IA) foi capaz de concluir todas as três variações de fases do jogo “Montezuma’s Revenge”, lançado para o Atari 2600 em 1984. Quem conseguiu esse feito foi o Go-Explore, nome dado a um conjunto de algoritmos desenvolvidos por pesquisadores da Uber.

Obter uma boa pontuação nesse jogo é considerado como um grande marco para empresas da área, com organizações como a DeepMind e a OpenAI já tendo criado programas capazes de marcar alguns pontos. No entanto, essas versões precisavam assistir a um jogador humano para aprender como o game funciona antes de darem início às suas tentativas.

Isso não acontece no caso de Go-Explore, que compreende o objetivo de “Montezuma’s Revenge” sem precisar ver alguém jogando antes. Esse é um acontecimento digno de destaque porque a “recompensa” (passar de fase) não é algo fácil de ser entendido por uma máquina, sendo necessário coletar itens, derrotar inimigos e desbloquear sessões específicas da área para conseguir os melhores números.

Em todos os casos, as inteligências artificiais concorrentes ficavam na média dos 11 mil pontos, com o recorde anterior delas sendo de 17 mil pontos. Go-Explore, por sua vez, chegou a marcar 2 milhões de pontos, alcançando o nível 159 do jogo. Ela também se destacou ao jogar “Pitfall!”, fazendo 21 mil pontos em um jogo no qual nenhuma IA tinha conseguido pontuar até então.

Esse também é um exemplo de jogo complicado para as máquinas, pois a recompensa depende da coleta de itens e não simplesmente de avançar pelo maior número de telas possível sem morrer. Para que a Go-Explore aprendesse isso, ela jogou diversas vezes até entender quais ações resultavam em uma pontuação maior e quais não eram revertidas em pontos.

Para os pesquisadores, esses resultados são promissores e devem ser utilizados principalmente na robótica. A partir dele, é possível que máquinas testem diversas soluções antes de decidir qual é a melhor e executar apenas essa. Você pode ver uma versão inicial do artigo com os resultados da pesquisa no site da Uber.

Veja também


Fontes