Table of Contents
Fetching ...

Usando LLMs para Programar Jogos de Tabuleiro e Variações

Álvaro Guglielmin Becker, Lana Bertoldo Rossato, Anderson Rocha Tavares

TL;DR

O trabalho propõe uma avaliação sistemática da capacidade de três LLMs em gerar código Python para jogos de tabuleiro e variantes, explorando tanto implementações independentes quanto via Boardwalk API. Utiliza prompts padronizados para 6 jogos com 3 variações cada, totalizando 108 testes, com foco em fidelidade de implementação e raciocínio de alto nível sobre as regras. Compara abordagens baseadas em descrições de regras em linguagem natural e no conhecimento prévio dos modelos, discutindo limitações associadas a gramáticas de GDLs como Ludii. Os resultados devem orientar designers de jogos e pesquisadores na seleção de estratégias de prompting e na utilidade da Boardwalk API para padronização e integração com agentes de IA.

Abstract

Creating programs to represent board games can be a time-consuming task. Large Language Models (LLMs) arise as appealing tools to expedite this process, given their capacity to efficiently generate code from simple contextual information. In this work, we propose a method to test how capable three LLMs (Claude, DeepSeek and ChatGPT) are at creating code for board games, as well as new variants of existing games.

Usando LLMs para Programar Jogos de Tabuleiro e Variações

TL;DR

O trabalho propõe uma avaliação sistemática da capacidade de três LLMs em gerar código Python para jogos de tabuleiro e variantes, explorando tanto implementações independentes quanto via Boardwalk API. Utiliza prompts padronizados para 6 jogos com 3 variações cada, totalizando 108 testes, com foco em fidelidade de implementação e raciocínio de alto nível sobre as regras. Compara abordagens baseadas em descrições de regras em linguagem natural e no conhecimento prévio dos modelos, discutindo limitações associadas a gramáticas de GDLs como Ludii. Os resultados devem orientar designers de jogos e pesquisadores na seleção de estratégias de prompting e na utilidade da Boardwalk API para padronização e integração com agentes de IA.

Abstract

Creating programs to represent board games can be a time-consuming task. Large Language Models (LLMs) arise as appealing tools to expedite this process, given their capacity to efficiently generate code from simple contextual information. In this work, we propose a method to test how capable three LLMs (Claude, DeepSeek and ChatGPT) are at creating code for board games, as well as new variants of existing games.

Paper Structure

This paper contains 4 sections, 1 figure.

Figures (1)

  • Figure 1: Prompt usado para a implementação independente do Jogo da Velha com variação de regras. A expressão "$CHANGE" é substituída pela descrição da regra modificada nos retângulos cinza.