Usando LLMs para Programar Jogos de Tabuleiro e Variações
Álvaro Guglielmin Becker, Lana Bertoldo Rossato, Anderson Rocha Tavares
TL;DR
O trabalho propõe uma avaliação sistemática da capacidade de três LLMs em gerar código Python para jogos de tabuleiro e variantes, explorando tanto implementações independentes quanto via Boardwalk API. Utiliza prompts padronizados para 6 jogos com 3 variações cada, totalizando 108 testes, com foco em fidelidade de implementação e raciocínio de alto nível sobre as regras. Compara abordagens baseadas em descrições de regras em linguagem natural e no conhecimento prévio dos modelos, discutindo limitações associadas a gramáticas de GDLs como Ludii. Os resultados devem orientar designers de jogos e pesquisadores na seleção de estratégias de prompting e na utilidade da Boardwalk API para padronização e integração com agentes de IA.
Abstract
Creating programs to represent board games can be a time-consuming task. Large Language Models (LLMs) arise as appealing tools to expedite this process, given their capacity to efficiently generate code from simple contextual information. In this work, we propose a method to test how capable three LLMs (Claude, DeepSeek and ChatGPT) are at creating code for board games, as well as new variants of existing games.
