Mitigating Individual Skin Tone Bias in Skin Lesion Classification through Distribution-Aware Reweighting

Kuniko Paxton; Zeinab Dehghani; Koorosh Aslansefat; Dhavalkumar Thakker; Yiannis Papadopoulos

Mitigating Individual Skin Tone Bias in Skin Lesion Classification through Distribution-Aware Reweighting

Kuniko Paxton, Zeinab Dehghani, Koorosh Aslansefat, Dhavalkumar Thakker, Yiannis Papadopoulos

TL;DR

This work tackles fairness in skin lesion classification by reframing skin tone as a continuous distribution rather than a discrete category. It introduces a KDE-based approach on ITA-derived skin-tone representations and evaluates twelve distance metrics to quantify disparities, culminating in a Distance-based Reweighting (DRW) loss to address underrepresentation. Across CNN and transformer architectures, DRW consistently reduces the link between tone-density and accuracy, with Fidelity Similarity and related metrics proving particularly effective. The framework advances individual-level fairness in dermatology and offers generalizable methods for continuous sensitive attributes in medical imaging.

Abstract

Skin color has historically been a focal point of discrimination, yet fairness research in machine learning for medical imaging often relies on coarse subgroup categories, overlooking individual-level variations. Such group-based approaches risk obscuring biases faced by outliers within subgroups. This study introduces a distribution-based framework for evaluating and mitigating individual fairness in skin lesion classification. We treat skin tone as a continuous attribute rather than a categorical label, and employ kernel density estimation (KDE) to model its distribution. We further compare twelve statistical distance metrics to quantify disparities between skin tone distributions and propose a distance-based reweighting (DRW) loss function to correct underrepresentation in minority tones. Experiments across CNN and Transformer models demonstrate: (i) the limitations of categorical reweighting in capturing individual-level disparities, and (ii) the superior performance of distribution-based reweighting, particularly with Fidelity Similarity (FS), Wasserstein Distance (WD), Hellinger Metric (HM), and Harmonic Mean Similarity (HS). These findings establish a robust methodology for advancing fairness at individual level in dermatological AI systems, and highlight broader implications for sensitive continuous attributes in medical image analysis.

Mitigating Individual Skin Tone Bias in Skin Lesion Classification through Distribution-Aware Reweighting

TL;DR

Abstract

Mitigating Individual Skin Tone Bias in Skin Lesion Classification through Distribution-Aware Reweighting

TL;DR

Abstract

Paper Structure

Table of Contents

Figures (9)