OmniField: Conditioned Neural Fields for Robust Multimodal Spatiotemporal Learning

Kevin Valencia; Thilina Balasooriya; Xihaier Luo; Shinjae Yoo; David Keetae Park

OmniField: Conditioned Neural Fields for Robust Multimodal Spatiotemporal Learning

Kevin Valencia, Thilina Balasooriya, Xihaier Luo, Shinjae Yoo, David Keetae Park

TL;DR

OmniField tackles the problem of learning from sparse, irregular, and noisy multimodal spatiotemporal data with varying modality availability. It introduces a continuity-aware conditioned neural field that leverages multimodal crosstalk (MCT), iterative cross-modal refinement (ICMR), and fleximodal fusion to fuse context across modalities before decoding, without gridding or surrogate imputation. Across ClimSim-THW and EPA-AQS benchmarks, OmniField outperforms eight strong baselines and shows robustness to heavy sensor noise, highlighting its practical viability for real-world scientific sensing. The work offers a unified framework for reconstruction, interpolation, forecasting, and cross-modal prediction under incomplete observations, with implications for climate science, air quality, and other multimodal physical systems.

Abstract

Multimodal spatiotemporal learning on real-world experimental data is constrained by two challenges: within-modality measurements are sparse, irregular, and noisy (QA/QC artifacts) but cross-modally correlated; the set of available modalities varies across space and time, shrinking the usable record unless models can adapt to arbitrary subsets at train and test time. We propose OmniField, a continuity-aware framework that learns a continuous neural field conditioned on available modalities and iteratively fuses cross-modal context. A multimodal crosstalk block architecture paired with iterative cross-modal refinement aligns signals prior to the decoder, enabling unified reconstruction, interpolation, forecasting, and cross-modal prediction without gridding or surrogate preprocessing. Extensive evaluations show that OmniField consistently outperforms eight strong multimodal spatiotemporal baselines. Under heavy simulated sensor noise, performance remains close to clean-input levels, highlighting robustness to corrupted measurements.

OmniField: Conditioned Neural Fields for Robust Multimodal Spatiotemporal Learning

TL;DR

Abstract

OmniField: Conditioned Neural Fields for Robust Multimodal Spatiotemporal Learning

TL;DR

Abstract

Paper Structure

Table of Contents

Figures (19)