OpenAutoNLU: Open Source AutoML Library for NLU

Grigory Arshinov; Aleksandr Boriskin; Sergey Senichev; Ayaz Zaripov; Daria Galimzianova; Daniil Karpov; Leonid Sanochkin

OpenAutoNLU: Open Source AutoML Library for NLU

Grigory Arshinov, Aleksandr Boriskin, Sergey Senichev, Ayaz Zaripov, Daria Galimzianova, Daniil Karpov, Leonid Sanochkin

TL;DR

Abstract

OpenAutoNLU is an open-source automated machine learning library for natural language understanding (NLU) tasks, covering both text classification and named entity recognition (NER). Unlike existing solutions, we introduce data-aware training regime selection that requires no manual configuration from the user. The library also provides integrated data quality diagnostics, configurable out-of-distribution (OOD) detection, and large language model (LLM) features, all within a minimal lowcode API. The demo app is accessible here https://openautonlu.dev.

OpenAutoNLU: Open Source AutoML Library for NLU

TL;DR

Abstract

Paper Structure (25 sections, 2 figures, 6 tables)

This paper contains 25 sections, 2 figures, 6 tables.

Introduction
Background
OpenAutoNLU
Structure
Data quality
Named Entity Recognition.
Optimized-inference-ready model serialization
Text Classification Training Pipeline
Data Quality
Objective and search strategy.
Data-level optimisation
OOD detection optimisation
LLM-based test set generation
Experiments
OOD Unaware Regime
...and 10 more sections

Figures (2)

Figure 1: Text Classification Training Pipeline and Inference Pipeline flow
Figure 2: This graph illustrates the ratio between performance in macro F1 on classification tasks and time in seconds took to train the solution. Measures are averaged between four different text classification datasets.

OpenAutoNLU: Open Source AutoML Library for NLU

TL;DR

Abstract

OpenAutoNLU: Open Source AutoML Library for NLU

Authors

TL;DR

Abstract

Table of Contents

Figures (2)