QDA-SQL: Questions Enhanced Dialogue Augmentation for Multi-Turn Text-to-SQL

Yinggang Sun; Ziming Guo; Haining Yu; Chuanyi Liu; Xiang Li; Bingxuan Wang; Xiangzhan Yu; Tiancheng Zhao

QDA-SQL: Questions Enhanced Dialogue Augmentation for Multi-Turn Text-to-SQL

Yinggang Sun, Ziming Guo, Haining Yu, Chuanyi Liu, Xiang Li, Bingxuan Wang, Xiangzhan Yu, Tiancheng Zhao

TL;DR

Experimental results demonstrate that QDA-SQL enables fine-tuned models to exhibit higher performance on SQL statement accuracy and enhances their ability to handle complex, unanswerable questions in multi-turn Text-to-SQL tasks.

Abstract

Fine-tuning large language models (LLMs) for specific domain tasks has achieved great success in Text-to-SQL tasks. However, these fine-tuned models often face challenges with multi-turn Text-to-SQL tasks caused by ambiguous or unanswerable questions. It is desired to enhance LLMs to handle multiple types of questions in multi-turn Text-to-SQL tasks. To address this, we propose a novel data augmentation method, called QDA-SQL, which generates multiple types of multi-turn Q\&A pairs using LLMs. In QDA-SQL, we introduce a method incorporating validation and correction mechanisms to handle complex multi-turn Text-to-SQL tasks. Experimental results demonstrate that QDA-SQL enables fine-tuned models to exhibit higher performance on SQL statement accuracy and enhances their ability to handle complex, unanswerable questions in multi-turn Text-to-SQL tasks. The generation script and test set are released at https://github.com/mcxiaoxiao/QDA-SQL

QDA-SQL: Questions Enhanced Dialogue Augmentation for Multi-Turn Text-to-SQL

TL;DR

Abstract

Paper Structure (26 sections, 4 equations, 9 figures, 8 tables)

This paper contains 26 sections, 4 equations, 9 figures, 8 tables.

Introduction
Related Work
Text-to-SQL
Data augmentation for Text-to-SQL
Preliminary
Thematic Relation
Question-Answer Type
Methods
Task Formulation
Generate Interactions
Goal SQL
Random Combination
CoT
Verify and Refine
StateFlow Design
...and 11 more sections

Figures (9)

Figure 1: User-LLM dialogues with various question types.
Figure 2: Overview of QDA-SQL processes.
Figure 3: Overview of StateFlow processes
Figure 4: SQL AST depths in enhanced vs. original samples
Figure 5: Dialogue lengths in enhanced vs. original samples
...and 4 more figures

QDA-SQL: Questions Enhanced Dialogue Augmentation for Multi-Turn Text-to-SQL

TL;DR

Abstract

QDA-SQL: Questions Enhanced Dialogue Augmentation for Multi-Turn Text-to-SQL

Authors

TL;DR

Abstract

Table of Contents

Figures (9)