A Cross-Lingual Statutory Article Retrieval Dataset for Taiwan Legal Studies

Yen-Hsiang Wang; Feng-Dian Su; Tzu-Yu Yeh; Yao-Chung Fan

A Cross-Lingual Statutory Article Retrieval Dataset for Taiwan Legal Studies

Yen-Hsiang Wang, Feng-Dian Su, Tzu-Yu Yeh, Yao-Chung Fan

TL;DR

This paper introduces a cross-lingual statutory article retrieval (SAR) dataset designed to enhance legal information retrieval in multilingual settings, focusing on mitigating translation errors and improving cross-lingual retrieval performance.

Abstract

This paper introduces a cross-lingual statutory article retrieval (SAR) dataset designed to enhance legal information retrieval in multilingual settings. Our dataset features spoken-language-style legal inquiries in English, paired with corresponding Chinese versions and relevant statutes, covering all Taiwanese civil, criminal, and administrative laws. This dataset aims to improve access to legal information for non-native speakers, particularly for foreign nationals in Taiwan. We propose several LLM-based methods as baselines for evaluating retrieval effectiveness, focusing on mitigating translation errors and improving cross-lingual retrieval performance. Our work provides a valuable resource for developing inclusive legal information retrieval systems.

A Cross-Lingual Statutory Article Retrieval Dataset for Taiwan Legal Studies

TL;DR

Abstract

A Cross-Lingual Statutory Article Retrieval Dataset for Taiwan Legal Studies

TL;DR

Abstract

Paper Structure

Table of Contents

Figures (9)