DDO: Dual-Decision Optimization for LLM-Based Medical Consultation via Multi-Agent Collaboration

Zhihao Jia; Mingyi Jia; Junwen Duan; Jianxin Wang

DDO: Dual-Decision Optimization for LLM-Based Medical Consultation via Multi-Agent Collaboration

Zhihao Jia, Mingyi Jia, Junwen Duan, Jianxin Wang

TL;DR

DDO tackles the dual nature of medical consultation by decoupling symptom inquiry (sequential, high-dimensional) from disease diagnosis (classification) and solving them with a four-agent, memory-guided workflow. A Diagnosis Agent provides confidence via Binary Token Probability with a calibrated, in-batch contrastive adapter; a Policy Agent coupled with an Inquiry Agent uses masked sampling and PPO-based RL to generate informative candidate actions, while a Patient Agent simulates responses. Across three real MC datasets, DDO consistently outperforms other LLM-based methods and matches state-of-the-art generation-based approaches, while requiring far less training overhead. This modular, transparent design improves diagnostic accuracy and offers practical pathways for scalable MC with constrained interaction turns.

Abstract

Large Language Models (LLMs) demonstrate strong generalization and reasoning abilities, making them well-suited for complex decision-making tasks such as medical consultation (MC). However, existing LLM-based methods often fail to capture the dual nature of MC, which entails two distinct sub-tasks: symptom inquiry, a sequential decision-making process, and disease diagnosis, a classification problem. This mismatch often results in ineffective symptom inquiry and unreliable disease diagnosis. To address this, we propose \textbf{DDO}, a novel LLM-based framework that performs \textbf{D}ual-\textbf{D}ecision \textbf{O}ptimization by decoupling the two sub-tasks and optimizing them with distinct objectives through a collaborative multi-agent workflow. Experiments on three real-world MC datasets show that DDO consistently outperforms existing LLM-based approaches and achieves competitive performance with state-of-the-art generation-based methods, demonstrating its effectiveness in the MC task. The code is available at https://github.com/zh-jia/DDO.

DDO: Dual-Decision Optimization for LLM-Based Medical Consultation via Multi-Agent Collaboration

TL;DR

Abstract

DDO: Dual-Decision Optimization for LLM-Based Medical Consultation via Multi-Agent Collaboration

TL;DR

Abstract

Paper Structure

Table of Contents

Figures (4)