Maschinelle Übersetzung ohne US-Cloud-Zwang: Quelloffene Alternativen zu DeepL
Wer Texte maschinell übersetzt, schickt sie in der Regel an Server in den USA. Das muss nicht sein, es gibt europäische und selbst gehostete Alternativen.
DeepL gilt zurecht als einer der besten maschinellen Übersetzungsdienste. Die Qualität ist beeindruckend, die Bedienung einfach, und das Unternehmen sitzt in Köln. Soweit die gute Nachricht.
Die weniger gute: DeepL verarbeitet zukünftig einen Teil seiner Anfragen über Amazon Web Services (AWS). Damit landen Texte, darunter möglicherweise vertrauliche Geschäftsinformationen, personenbezogene Daten oder interne Dokumente, auf Infrastruktur eines US-amerikanischen Cloud-Anbieters. Für Unternehmen, die Wert auf digitale Souveränität legen, und für alle, die sich ernsthaft mit der DSGVO auseinandersetzen, ist das ein Problem.
Warum die Infrastruktur zählt
Die DSGVO verlangt nicht nur, dass Daten „irgendwie geschützt" werden. Sie verlangt, dass Verantwortliche wissen, wo personenbezogene Daten verarbeitet werden, wer darauf Zugriff hat und auf welcher Rechtsgrundlage eine Übermittlung in Drittstaaten erfolgt.
Bei US-Cloud-Anbietern besteht ein strukturelles Problem: Der CLOUD Act verpflichtet US-Unternehmen, auf Anfrage amerikanischer Behörden Daten herauszugeben, auch wenn diese physisch in der EU gespeichert sind. Das EU-US Data Privacy Framework soll diese Lücke schließen, aber seine Tragfähigkeit ist unter Datenschützern umstritten. Schrems I und Schrems II lassen grüßen.
Für Unternehmen in regulierten Branchen z.B. Pharma, Finanzwesen, öffentliche Verwaltung reicht es nicht, auf die Datenschutzerklärung eines SaaS-Anbieters zu vertrauen. Die Frage lautet: Kann ich nachweisen, dass die Daten meiner Kunden und Mitarbeiter Europa nie verlassen?
Bei einem selbst gehosteten Übersetzungsdienst auf europäischer Infrastruktur lautet die Antwort: Ja.
Die quelloffenen Alternativen (Stand März 2026)
Mittlerweile gibt es eine Reihe von Alternativen, die die oben genannten Probleme vermeiden.
LibreTranslate
LibreTranslate ist die bekannteste Open-Source-Alternative. Der Dienst basiert auf der Argos-Translate-Bibliothek, die wiederum das OpenNMT-Framework nutzt. Die wesentlichen Eigenschaften:
- Vollständig selbst gehostet – keine Abhängigkeit von Google, Azure oder AWS
- Offline-fähig – kann komplett ohne Internetverbindung betrieben werden
- REST-API – lässt sich in bestehende Workflows und Anwendungen integrieren
- Docker-fähig – Deployment in wenigen Minuten
- Lizenz: AGPL-3.0
Die Übersetzungsqualität ist ehrlich gesagt nicht auf DeepL-Niveau. Für gängige europäische Sprachpaare wie Deutsch–Englisch ist sie für interne Zwecke, Entwürfe und Entwicklungsumgebungen brauchbar. Für publikationsfähige Texte muss man allerdings nacharbeiten.
Interessant ist das neue Unterprojekt LTEngine, das lokale LLM-basierte Übersetzung ermöglicht und zur LibreTranslate-API kompatibel ist. Hier dürfte sich in den kommenden Monaten qualitativ einiges tun.
Deployment-Empfehlung: Ein europäischer VPS bei Hetzner, Netcup oder einem vergleichbaren Anbieter. Wer ohnehin einen eigenen Server betreibt (etwa für Nextcloud), kann LibreTranslate dort als zusätzlichen Container laufen lassen.
Opus-MT (Helsinki-NLP)
Opus-MT ist ein Forschungsprojekt der Universität Helsinki und verfolgt einen anderen Ansatz: Statt eines universellen Modells gibt es über 1.500 spezialisierte Modelle für einzelne Sprachrichtungen. Ein Modell für Deutsch→Englisch, eines für Englisch→Deutsch, und so weiter.
Der Vorteil: Die spezialisierten Modelle liefern für ihre jeweiligen Sprachpaare oft bessere Ergebnisse als breiter aufgestellte Systeme – trotz geringerer Modellgröße. Typische Modelle sind nur rund 300 MB groß.
- Komplett lokal – läuft auf eigener Hardware ohne Cloud-Anbindung
- Lizenz: CC-BY 4.0 – kommerziell nutzbar
- Qualität: Für gut abgedeckte Paare (insbesondere europäische Sprachen) solide
- Laufzeitumgebung: Marian NMT oder Hugging Face Transformers
Der Nachteil: Man braucht für jede Sprachrichtung ein eigenes Modell. Wer 20 Sprachpaare abdecken will, verwaltet 40 Modelle. Für den typischen Bedarf eines europäischen KMU – primär Deutsch↔Englisch, vielleicht noch Französisch – ist das aber sehr überschaubar.
SYSTRAN (teilweise quelloffen)
SYSTRAN ist ein französisches Unternehmen mit über 50 Jahren Erfahrung in maschineller Übersetzung. Das Besondere: SYSTRAN hat 2016 gemeinsam mit Harvard NLP das Open-Source-Framework OpenNMT gegründet, das heute von einer großen Community genutzt wird.
Das SYSTRAN-Produkt selbst ist kommerziell, bietet aber:
- On-Premise-Deployment – die Software läuft auf eigenen Servern
- Cloud-Option bei OVH – europäischer Cloud-Anbieter mit Rechenzentren in der EU
- Über 140 Sprachkombinationen
- Anpassbare Modelle – branchenspezifisches Training mit eigenen Übersetzungsspeichern
Für Unternehmen, die professionelle Übersetzungsqualität mit europäischer Datenhaltung verbinden wollen und dafür Budget haben, ist SYSTRAN eine ernsthafte Option.
Apertium
Der Vollständigkeit halber: Apertium ist ein regelbasiertes Open-Source-Übersetzungssystem, das an spanischen Universitäten entwickelt wurde. Es eignet sich gut für nahverwandte Sprachpaare (etwa Katalanisch↔Spanisch), ist aber für Deutsch↔Englisch nicht wirklich praxistauglich.
Vergleich auf einen Blick
| Kriterium | LibreTranslate | Opus-MT | SYSTRAN |
|---|---|---|---|
| Open Source | Ja (AGPL-3.0) | Ja (CC-BY 4.0) | Teilweise (OpenNMT) |
| Self-Hosting | Ja | Ja | Ja (on-premise) |
| Offline-fähig | Ja | Ja | Ja |
| Übersetzungsqualität | Ausreichend | Gut | Sehr gut |
| Europäische Infrastruktur | Eigene Wahl | Eigene Wahl | OVH / on-premise |
| Kosten | Kostenlos | Kostenlos | Kommerziell |
| Einrichtungsaufwand | Gering (Docker) | Mittel | Hoch |
Fazit: Souveränität ist eine Entscheidung
Ganz ehrlich: Keine dieser Alternativen erreicht derzeit die Gesamtqualität von DeepL. Aber darum geht es nicht allein.
Die Frage ist, ob man bereit ist, für etwas weniger Komfort deutlich mehr Kontrolle über die eigenen Daten zu bekommen. Für interne Kommunikation, Entwürfe, technische Dokumentation und automatisierte Workflows ist ein selbst gehosteter Dienst wie LibreTranslate oder Opus-MT bereits heute praktikabel.
Und die Entwicklung steht nicht still: LLM-basierte Übersetzungsmodelle, die lokal laufen, werden rasant besser. Das Qualitätsgefälle wird kleiner.
Für Unternehmen, die unter NIS2, DORA oder branchenspezifischen Compliance-Anforderungen stehen, ist die Infrastrukturfrage ohnehin keine optionale: Wer nicht nachweisen kann, wo Daten verarbeitet werden, hat ein Compliance-Problem. Und zwar egal wie gut die Übersetzung ist.
Digitale Souveränität beginnt nicht bei großen Plattformentscheidungen. Sie beginnt bei den alltäglichen Werkzeugen, die wir benutzen, ohne groß darüber nachzudenken. Der Übersetzungsdienst ist eines davon.