Nach dem OLG Hamm: die neue Messlatte für Betreiber*innen von KI-Chatbots
Das Urteil des Oberlandesgerichts Hamm zu KI-Chatbots vom 12. Mai 2026 nimmt Betreiber*innen eines KI-Chatbots vollumfänglich für das in die Pflicht, was der Bot von sich gibt – selbst dann, wenn die Aussage frei erfunden war. Ein Hinweis im Sinne von „Ich bin eine KI“ verlagert diese Haftung nicht. Auch der Versuch, das Modell zu Quellenangaben zu zwingen, scheitert. Halluzinationen sind für Betreiber*innen in Deutschland kein abstraktes Risiko mehr. Nach diesem Urteil landet die Rechnung bei den Betreiber*innen, sobald der Chatbot eine Behauptung erfindet. Der Fall liegt nun beim Bundesgerichtshof (BGH) zur Bestätigung.
Was das OLG-Hamm-Chatbot-Urteil tatsächlich entschieden hat
Geklagt hatte die Verbraucherzentrale NRW im Verfahren (Az. 4 UKl 3/25) gegen eine Klinik für ästhetische Medizin, deren Chatbot ihre beiden aus dem Reality-TV bekannten Ärzte als „Fachärzte für ästhetische Medizin“ bewarb – eine Facharztbezeichnung, die nach den Regeln der Ärztekammer schlicht nicht existiert. Die Verteidigung der Klinik lautete: „Das hat sich die KI ausgedacht.“ Das Gericht ließ dieses Argument nicht gelten.
Das Gericht behandelte den Chatbot als Verlängerung des Unternehmens, nicht als externen Dritten. Alles, was der Bot einer Kundin oder einem Kunden mitteilt, gilt als geschäftliche Aussage der Betreiber*innen – unabhängig davon, ob ein Mensch diese Worte jemals selbst getippt hat. Rechtlich greift hier das UWG, das deutsche Gesetz gegen den unlauteren Wettbewerb. Jede erfundene Aussage ist damit ein offener Anlass für eine Abmahnung. Das Gericht hat die Revision zum BGH zugelassen. Damit ist absehbar, dass das Urteil bundesweite Wirkung entfaltet – und keineswegs nur Kliniken trifft.
Drei Betreiber*innen-Reflexe, die das OLG Hamm nicht überleben
Wenn Betreiber*innen vor dem Risiko von Halluzinationen stehen, greifen sie typischerweise zu drei Lösungsansätzen. Die Argumentation des Gerichts schwächt alle drei. Die folgende Tabelle ordnet jeden Reflex seiner tatsächlichen Wirkung zu – und dem, was er offenlässt.
| Was er tatsächlich bewirkt | Was er weiterhin nicht leisten kann | |||
|---|---|---|---|---|
| Betreiber*innen-Reflex | ||||
| Den Chatbot auf geprüfte, eigene Inhalte beschränken | ||||
| Den Chatbot auf geprüfte, eigene Inhalte beschränken | Verengt die thematische Oberfläche | Die generative Schicht daran hindern, Formulierungen frei zu erfinden | ||
| Einen Hinweis „Ich bin eine KI“ anzeigen | ||||
| Einen Hinweis „Ich bin eine KI“ anzeigen | Steuert die Erwartungen der Nutzer*innen | Die rechtliche Haftung auf die Nutzer*innen verlagern | ||
| Quellenangaben im Modell erzwingen | ||||
| Quellenangaben im Modell erzwingen | Fügt ein Referenzgerüst hinzu | Verhindern, dass das Modell die zitierte Quelle ebenfalls erfindet | ||
Der Trugschluss vom sauberen Datenbestand
Den Chatbot auf geprüfte, eigene Inhalte zu beschränken, verringert die Angriffsfläche – schließt sie aber nicht. Das Retrieval zieht passende Textfragmente heran, anschließend formuliert die generative Schicht den Satz. Das Modell ist in dem begrenzt, woraus es schöpfen darf, nicht in dem, was es schreiben kann. Begrenzte Eingaben erzeugen keine begrenzten Ausgaben.
Die Falle des Haftungsausschlusses
Ein gut sichtbarer Hinweis „Diese Antwort wurde von einer KI erzeugt, bitte bestätigen Sie sie mit unserem Team“ dämpft die Erwartungen der Nutzer*innen – verlagert aber keine rechtliche Verantwortung. Die Argumentation des Gerichts behandelt den Chatbot als Sprachrohr der Betreiber*innen, ganz gleich, was der Chatbot über sich selbst sagt. Wer auf solche Disclaimer als Verteidigungslinie setzt, hat gerade gehört, dass sie keine ist.
Der Quellenangaben-Patch
Das Modell zu zwingen, eine Quelle anzuhängen, hilft nur dann, wenn es diese Quelle nicht ebenfalls erfinden kann. Ein System, das eine Facharztbezeichnung halluziniert, halluziniert auch die URL, die sie angeblich belegt. Quellenangaben allein sind kein Beweis. Erst eine unabhängige Prüfinstanz, auf die das generierende System keinen Einfluss hat, durchbricht diesen Kreislauf.
Was eine unabhängige Review-Schicht prüft
Eine unabhängige Review-Schicht steht für einen zweigeteilten Workflow. Eine KI erzeugt die Antwort, eine zweite prüft sie, bevor die Kund*innen sie zu sehen bekommen. Das Prüfmodell stammt aus einer anderen Modellfamilie und arbeitet mit den anpassbaren Bewertungskriterien der jeweiligen Organisation. Diese Kriterien decken die faktische Richtigkeit bei besonders heiklen Aussagen ab – etwa Berufsbezeichnungen, Qualifikationen, Preise und Produktmerkmale –, ebenso Markenkonformität, regulatorische Grenzen und Tonalität.
Jede Prüfung erzeugt einen Score, eine klare Freigabe- oder Ablehnungsentscheidung und ein strukturiertes Audit-Protokoll. Antworten, die durchfallen, werden vor der Veröffentlichung verworfen und neu generiert. Die Kund*innen erhalten nie die Version, die die Abmahnung ausgelöst hätte. Grenzfälle lassen sich mit vollständigem Kontext an eine menschliche Prüfinstanz weiterleiten, sodass der Chatbot nicht die letzte Verteidigungslinie ist.
Im produktiven Betrieb hört manuelle Prüfung auf, eine glaubwürdige Option zu sein. Personal hält mit dem Content-Volumen nicht Schritt, und das Urteil von Prüfer*innen driftet über die Zeit hinweg von den Kriterien ab. Automatisierte Content-Prüfung ist der einzige Weg, Durchsatz und Compliance gleichzeitig zu sichern.
Genau das ist die Architektur hinter MOVEX | AI Content Verifier. Dieselbe Prüflogik lässt sich auf Chatbot-Texte, Produktbeschreibungen, Werbetexte und KI-generierte Bilder anwenden. Der Audit Trail liefert Compliance-Teams einen Nachweis, den sie Prüfer*innen vorlegen können.
Der Fahrplan für Betreiber*innen unter dem OLG-Hamm-Urteil
Das OLG-Hamm-Chatbot-Urteil steuert auf eine bundesweite Bestätigung zu. Die Betreiberhaftung zieht mit. Sollte der BGH die Vorinstanz bestätigen, greift die Chatbot-Haftung in der Breite – und nicht nur bei der Klinik, die den Fall ausgelöst hat.
Im selben Zeitfenster läuft eine zweite Frist ab. Artikel 50 des EU AI Act tritt im August 2026 in Kraft, mit Schwerpunkt auf Kennzeichnung, ergänzt durch die in den Artikeln 12 und 13 festgelegten Vorschriften zur Dokumentation und Protokollierung. Das bewertete, datierte Prüfprotokoll, das der Betreiberhaftung gerecht wird, liefert den Prüfer*innen genau das, was in den Artikeln verlangt wird.
Das Urteil löst zudem eine leisere Frage. In den meisten Organisationen verteilt sich die Verantwortung für KI auf Informationssicherheit, Datenschutz, Qualitätsmanagement und Recht – ohne klare Eigentümerschaft. Eine dokumentierte Prüfentscheidung an jedem Chatbot-Output benennt die Entscheidung. Eine benannte Entscheidung benennt die Verantwortlichen. Aus der Organigramm-Frage wird so eine strukturelle Antwort statt einer politischen.
Die Stimmung in der Praxis bewegt sich in dieselbe Richtung. Deutsche KI-Entwickler*innen argumentieren zunehmend, dass Chatbots nicht für jede Aufgabe die richtige Standardschnittstelle zu Kund*innen sein sollten. Wo der Chatbot weiterhin die richtige Wahl ist, lautet die neue Messlatte: nachweisbare, automatisierte Prüfung jedes Outputs.
Compliance-Arbeit, die nach einem Thema für 2027 aussah, ist jetzt ein Thema für 2026. Der günstigste Zeitpunkt, eine unabhängige Review-Schicht einzuführen, lag vor dem Urteil. Der zweitgünstigste liegt vor der Bestätigung durch den BGH.
FAQ zur Chatbot-Haftung
Das Oberlandesgericht Hamm hat am 12. Mai 2026 (Az. 4 UKl 3/25) entschieden, dass Betreiber*innen eines KI-Chatbots vollumfänglich für die falschen Aussagen ihres Bots haften – einschließlich erfundener Facharztbezeichnungen. Rechtlicher Anknüpfungspunkt ist das UWG, das deutsche Gesetz gegen den unlauteren Wettbewerb. Das Gericht hat die Revision zum BGH zugelassen, damit hat das Prinzip einen Weg auf Bundesebene, der weit über die ursprüngliche Beklagte hinausreicht.
Das UWG macht jede erfundene geschäftliche Aussage zu einem Abmahngrund. Sobald ein Gericht Chatbot-Ausgaben als geschäftliche Aussage der Betreiber*innen behandelt, erbt jede Branche, die einen kund*innenseitigen Chatbot betreibt – Handel, Finanzdienstleistung, Gesundheitswesen, Reise – dieselbe Risikoposition wie die Klinik im Fall des OLG Hamm.
Mit einer Bestätigung durch den BGH wird die Betreiberhaftung für KI-Chatbot-Ausgaben in Deutschland zur bindenden Rechtsprechung. Betreiber*innen eines KI-Chatbots, die sich bislang auf Disclaimer oder modellseitige Quellenangaben als Verteidigung verlassen, werden nachweisbare Belege brauchen, dass jeder Output vor der Veröffentlichung geprüft wurde – nicht erst nach einer Beschwerde.
Eine separate KI-Instanz prüft jeden Chatbot-Output gegen die organisationseigenen Regeln. Sie erfasst die faktische Richtigkeit bei heiklen Aussagen, Markenkonformität, regulatorische Grenzen und Tonalität. Sie bewertet jeden Output, fällt eine Freigabe- oder Ablehnungsentscheidung und legt ein prüfbares Protokoll an.
Artikel 50 des EU AI Act tritt im August 2026 in Kraft und verlangt Kennzeichnung sowie prüfbare Nachweise für KI-generierte Outputs. Der Audit Trail, den eine unabhängige Review-Schicht erzeugt, beantwortet die Frage nach der Betreiberhaftung aus dem OLG-Hamm-Urteil und die Dokumentationsfrage aus Artikel 50 im selben Datensatz.
Mehr über künstliche Intelligenz und virtuelle Assistenten
Möchten Sie Content-Verifizierung mit KI optimieren?
Unsere Expert*innen beraten Sie gerne. Kontaktieren Sie uns.