Datenschutzkonformer LLM-Einsatz: Eine Open-Source-Referenzarchitektur

Marian Lambert; Thomas Schuster; Nico Döring; Robin Krüger

Datenschutzkonformer LLM-Einsatz: Eine Open-Source-Referenzarchitektur

Marian Lambert, Thomas Schuster, Nico Döring, Robin Krüger

TL;DR

Der Beitrag adressiert Datenschutz- und Sicherheitsherausforderungen bei Large Language Models durch eine Open-Source-basierte Referenzarchitektur für geschlossene Systeme. Er analysiert Motivation, regulatorische Anforderungen und technische sowie organisatorische Herausforderungen und präsentiert eine detaillierte Referenzarchitektur mit klaren Modulen wie Frontend, Backend, LLM-Inferenz-Engine, Datenbanken, Caching, Security, Monitoring, Deployment und Testing. Zudem wird eine Evaluations- und Monitoring-Pipeline skizziert, und es werden Open-Source-Tools und -Frameworks für Implementierung, Sicherheit und Betrieb diskutiert. Die Ergebnisse zeigen, dass geschlossene LLM-Systeme praktikabel sind, jedoch erhebliche Rechenressourcen, Wartung und sorgfältige Integration offener Stack-Technologien erfordern; hybride Ansätze könnten Datenschutz, Skalierbarkeit und Praxisnähe besser verbinden. Die Arbeit bietet Führungskräften und Entwicklern eine praxisnahe Grundlage zur Realisierung datenschutzkonformer LLM-Lösungen in regulierten Branchen.

Abstract

The development of Large Language Models (LLMs) has led to significant advancements in natural language processing and enabled numerous applications across various industries. However, many LLM-based solutions operate as open systems relying on cloud services, which pose risks to data confidentiality and security. To address these challenges, organizations require closed LLM systems that comply with data protection regulations while maintaining high performance. In this paper, we present a reference architecture for developing closed, LLM-based systems using open-source technologies. The architecture provides a flexible and transparent solution that meets strict data privacy and security requirements. We analyze the key challenges in implementing such systems, including computing resources, data management, scalability, and security risks. Additionally, we introduce an evaluation pipeline that enables a systematic assessment of system performance and compliance.

Datenschutzkonformer LLM-Einsatz: Eine Open-Source-Referenzarchitektur

TL;DR

Abstract

Datenschutzkonformer LLM-Einsatz: Eine Open-Source-Referenzarchitektur

TL;DR

Abstract

Paper Structure

Table of Contents

Figures (1)