VEDA: 3D Molecular Generation via Variance-Exploding Diffusion with Annealing

Peining Zhang; Jinbo Bi; Minghu Song

VEDA: 3D Molecular Generation via Variance-Exploding Diffusion with Annealing

Peining Zhang, Jinbo Bi, Minghu Song

TL;DR

VEDA introduces a principled framework for 3D molecular generation by unifying variance-exploding diffusion with annealing in an SE(3)-equivariant setting. It provides a theoretically grounded preconditioning scheme for coordinate prediction and an arcsin-based scheduler to balance exploration and refinement, enabling fast sampling with high chemical validity. Across QM9 and GEOM-DRUGS, VEDA delivers state-of-the-art stability and accuracy while matching flow-based efficiency at around 100 steps, and it achieves substantially lower relaxation energy than baselines. The work demonstrates a clear path toward rapid, accurate, native-3D molecular generation and highlights directions for future improvements, including explicit velocity-field outputs and property-conditioned generation.

Abstract

Diffusion models show promise for 3D molecular generation, but face a fundamental trade-off between sampling efficiency and conformational accuracy. While flow-based models are fast, they often produce geometrically inaccurate structures, as they have difficulty capturing the multimodal distributions of molecular conformations. In contrast, denoising diffusion models are more accurate but suffer from slow sampling, a limitation attributed to sub-optimal integration between diffusion dynamics and SE(3)-equivariant architectures. To address this, we propose VEDA, a unified SE(3)-equivariant framework that combines variance-exploding diffusion with annealing to efficiently generate conformationally accurate 3D molecular structures. Specifically, our key technical contributions include: (1) a VE schedule that enables noise injection functionally analogous to simulated annealing, improving 3D accuracy and reducing relaxation energy; (2) a novel preconditioning scheme that reconciles the coordinate-predicting nature of SE(3)-equivariant networks with a residual-based diffusion objective, and (3) a new arcsin-based scheduler that concentrates sampling in critical intervals of the logarithmic signal-to-noise ratio. On the QM9 and GEOM-DRUGS datasets, VEDA matches the sampling efficiency of flow-based models, achieving state-of-the-art valency stability and validity with only 100 sampling steps. More importantly, VEDA's generated structures are remarkably stable, as measured by their relaxation energy during GFN2-xTB optimization. The median energy change is only 1.72 kcal/mol, significantly lower than the 32.3 kcal/mol from its architectural baseline, SemlaFlow. Our framework demonstrates that principled integration of VE diffusion with SE(3)-equivariant architectures can achieve both high chemical accuracy and computational efficiency.

VEDA: 3D Molecular Generation via Variance-Exploding Diffusion with Annealing

TL;DR

Abstract

VEDA: 3D Molecular Generation via Variance-Exploding Diffusion with Annealing

TL;DR

Abstract

Paper Structure

Table of Contents

Figures (7)