Multi Anatomy X-Ray Foundation Model

Nishank Singla; Krisztian Koos; Farzin Haddadpour; Amin Honarmandi Shandiz; Lovish Chum; Xiaojian Xu; Qing Jin; Erhan Bas

Multi Anatomy X-Ray Foundation Model

Nishank Singla, Krisztian Koos, Farzin Haddadpour, Amin Honarmandi Shandiz, Lovish Chum, Xiaojian Xu, Qing Jin, Erhan Bas

TL;DR

This work addresses the limited generalization of chest-focused radiology models by introducing XR-0, a multi-anatomy X-ray foundation model trained with self-supervised learning on a large, diverse dataset. Built on a ViT-B backbone with image-level and patch-level objectives, XR-0 is evaluated across 12 datasets and 20 tasks, including retrieval, classification, segmentation, localization, visual grounding, and report generation, achieving state-of-the-art results on multi-anatomy benchmarks. A companion chest-specific model, CXR-0, and a multimodal extension, mXR-0, demonstrate that data diversity and text supervision further boost performance in generative tasks, such as radiology report generation. Overall, the results underscore anatomical diversity as a key driver of robust generalization in radiology AI, enabling scalable and adaptable clinical workflows while highlighting ongoing considerations for fairness and task-specific performance.

Abstract

X-ray imaging is a ubiquitous in radiology, yet most existing AI foundation models are limited to chest anatomy and fail to generalize across broader clinical tasks. In this work, we introduce XR-0, the multi-anatomy X-ray foundation model using self-supervised learning on a large, private dataset of 1.15 million images spanning diverse anatomical regions and evaluated across 12 datasets and 20 downstream tasks, including classification, retrieval, segmentation, localization, visual grounding, and report generation. XR-0 achieves state-of-the-art performance on most multi-anatomy tasks and remains competitive on chest-specific benchmarks. Our results demonstrate that anatomical diversity and supervision are critical for building robust, general-purpose medical vision models, paving the way for scalable and adaptable AI systems in radiology.

Multi Anatomy X-Ray Foundation Model

TL;DR

Abstract

Multi Anatomy X-Ray Foundation Model

TL;DR

Abstract

Paper Structure

Table of Contents

Figures (11)