Nach dem OLG Hamm: die neue Messlatte für Betreiber*innen von KI-Chatbots

Nahaufnahme eines Holzhammers auf einem Richtblock vor einem unscharfen Gerichtssaal-Hintergrund mit Säulen – Symbol für Recht und Regulierung

Das Urteil des Oberlandesgerichts Hamm zu KI-Chatbots vom 12. Mai 2026 nimmt Betreiber*innen eines KI-Chatbots vollumfänglich für das in die Pflicht, was der Bot von sich gibt – selbst dann, wenn die Aussage frei erfunden war. Ein Hinweis im Sinne von „Ich bin eine KI“ verlagert diese Haftung nicht. Auch der Versuch, das Modell zu Quellenangaben zu zwingen, scheitert. Halluzinationen sind für Betreiber*innen in Deutschland kein abstraktes Risiko mehr. Nach diesem Urteil landet die Rechnung bei den Betreiber*innen, sobald der Chatbot eine Behauptung erfindet. Der Fall liegt nun beim Bundesgerichtshof (BGH) zur Bestätigung.

Was das OLG-Hamm-Chatbot-Urteil tatsächlich entschieden hat

Geklagt hatte die Verbraucherzentrale NRW im Verfahren (Az. 4 UKl 3/25) gegen eine Klinik für ästhetische Medizin, deren Chatbot ihre beiden aus dem Reality-TV bekannten Ärzte als „Fachärzte für ästhetische Medizin“ bewarb – eine Facharztbezeichnung, die nach den Regeln der Ärztekammer schlicht nicht existiert. Die Verteidigung der Klinik lautete: „Das hat sich die KI ausgedacht.“ Das Gericht ließ dieses Argument nicht gelten.

Das Gericht behandelte den Chatbot als Verlängerung des Unternehmens, nicht als externen Dritten. Alles, was der Bot einer Kundin oder einem Kunden mitteilt, gilt als geschäftliche Aussage der Betreiber*innen – unabhängig davon, ob ein Mensch diese Worte jemals selbst getippt hat. Rechtlich greift hier das UWG, das deutsche Gesetz gegen den unlauteren Wettbewerb. Jede erfundene Aussage ist damit ein offener Anlass für eine Abmahnung. Das Gericht hat die Revision zum BGH zugelassen. Damit ist absehbar, dass das Urteil bundesweite Wirkung entfaltet – und keineswegs nur Kliniken trifft.

Drei Betreiber*innen-Reflexe, die das OLG Hamm nicht überleben

Wenn Betreiber*innen vor dem Risiko von Halluzinationen stehen, greifen sie typischerweise zu drei Lösungsansätzen. Die Argumentation des Gerichts schwächt alle drei. Die folgende Tabelle ordnet jeden Reflex seiner tatsächlichen Wirkung zu – und dem, was er offenlässt.

  Was er tatsächlich bewirkt Was er weiterhin nicht leisten kann
Betreiber*innen-Reflex
Den Chatbot auf geprüfte, eigene Inhalte beschränken
Den Chatbot auf geprüfte, eigene Inhalte beschränken Verengt die thematische Oberfläche Die generative Schicht daran hindern, Formulierungen frei zu erfinden
Einen Hinweis „Ich bin eine KI“ anzeigen
Einen Hinweis „Ich bin eine KI“ anzeigen Steuert die Erwartungen der Nutzer*innen Die rechtliche Haftung auf die Nutzer*innen verlagern
Quellenangaben im Modell erzwingen
Quellenangaben im Modell erzwingen Fügt ein Referenzgerüst hinzu Verhindern, dass das Modell die zitierte Quelle ebenfalls erfindet

Der Trugschluss vom sauberen Datenbestand
 

Den Chatbot auf geprüfte, eigene Inhalte zu beschränken, verringert die Angriffsfläche – schließt sie aber nicht. Das Retrieval zieht passende Textfragmente heran, anschließend formuliert die generative Schicht den Satz. Das Modell ist in dem begrenzt, woraus es schöpfen darf, nicht in dem, was es schreiben kann. Begrenzte Eingaben erzeugen keine begrenzten Ausgaben.
 

Die Falle des Haftungsausschlusses
 

Ein gut sichtbarer Hinweis „Diese Antwort wurde von einer KI erzeugt, bitte bestätigen Sie sie mit unserem Team“ dämpft die Erwartungen der Nutzer*innen – verlagert aber keine rechtliche Verantwortung. Die Argumentation des Gerichts behandelt den Chatbot als Sprachrohr der Betreiber*innen, ganz gleich, was der Chatbot über sich selbst sagt. Wer auf solche Disclaimer als Verteidigungslinie setzt, hat gerade gehört, dass sie keine ist.
 

Der Quellenangaben-Patch
 

Das Modell zu zwingen, eine Quelle anzuhängen, hilft nur dann, wenn es diese Quelle nicht ebenfalls erfinden kann. Ein System, das eine Facharztbezeichnung halluziniert, halluziniert auch die URL, die sie angeblich belegt. Quellenangaben allein sind kein Beweis. Erst eine unabhängige Prüfinstanz, auf die das generierende System keinen Einfluss hat, durchbricht diesen Kreislauf.
 

Was eine unabhängige Review-Schicht prüft

Eine unabhängige Review-Schicht steht für einen zweigeteilten Workflow. Eine KI erzeugt die Antwort, eine zweite prüft sie, bevor die Kund*innen sie zu sehen bekommen. Das Prüfmodell stammt aus einer anderen Modellfamilie und arbeitet mit den anpassbaren Bewertungskriterien der jeweiligen Organisation. Diese Kriterien decken die faktische Richtigkeit bei besonders heiklen Aussagen ab – etwa Berufsbezeichnungen, Qualifikationen, Preise und Produktmerkmale –, ebenso Markenkonformität, regulatorische Grenzen und Tonalität.

Jede Prüfung erzeugt einen Score, eine klare Freigabe- oder Ablehnungsentscheidung und ein strukturiertes Audit-Protokoll. Antworten, die durchfallen, werden vor der Veröffentlichung verworfen und neu generiert. Die Kund*innen erhalten nie die Version, die die Abmahnung ausgelöst hätte. Grenzfälle lassen sich mit vollständigem Kontext an eine menschliche Prüfinstanz weiterleiten, sodass der Chatbot nicht die letzte Verteidigungslinie ist.

Im produktiven Betrieb hört manuelle Prüfung auf, eine glaubwürdige Option zu sein. Personal hält mit dem Content-Volumen nicht Schritt, und das Urteil von Prüfer*innen driftet über die Zeit hinweg von den Kriterien ab. Automatisierte Content-Prüfung ist der einzige Weg, Durchsatz und Compliance gleichzeitig zu sichern.

Genau das ist die Architektur hinter MOVEX | AI Content Verifier. Dieselbe Prüflogik lässt sich auf Chatbot-Texte, Produktbeschreibungen, Werbetexte und KI-generierte Bilder anwenden. Der Audit Trail liefert Compliance-Teams einen Nachweis, den sie Prüfer*innen vorlegen können.

Der Fahrplan für Betreiber*innen unter dem OLG-Hamm-Urteil

Das OLG-Hamm-Chatbot-Urteil steuert auf eine bundesweite Bestätigung zu. Die Betreiberhaftung zieht mit. Sollte der BGH die Vorinstanz bestätigen, greift die Chatbot-Haftung in der Breite – und nicht nur bei der Klinik, die den Fall ausgelöst hat.

Im selben Zeitfenster läuft eine zweite Frist ab. Artikel 50 des EU AI Act tritt im August 2026 in Kraft, mit Schwerpunkt auf Kennzeichnung, ergänzt durch die in den Artikeln 12 und 13 festgelegten Vorschriften zur Dokumentation und Protokollierung. Das bewertete, datierte Prüfprotokoll, das der Betreiberhaftung gerecht wird, liefert den Prüfer*innen genau das, was in den Artikeln verlangt wird.

Das Urteil löst zudem eine leisere Frage. In den meisten Organisationen verteilt sich die Verantwortung für KI auf Informationssicherheit, Datenschutz, Qualitätsmanagement und Recht – ohne klare Eigentümerschaft. Eine dokumentierte Prüfentscheidung an jedem Chatbot-Output benennt die Entscheidung. Eine benannte Entscheidung benennt die Verantwortlichen. Aus der Organigramm-Frage wird so eine strukturelle Antwort statt einer politischen.

Die Stimmung in der Praxis bewegt sich in dieselbe Richtung. Deutsche KI-Entwickler*innen argumentieren zunehmend, dass Chatbots nicht für jede Aufgabe die richtige Standardschnittstelle zu Kund*innen sein sollten. Wo der Chatbot weiterhin die richtige Wahl ist, lautet die neue Messlatte: nachweisbare, automatisierte Prüfung jedes Outputs.

Compliance-Arbeit, die nach einem Thema für 2027 aussah, ist jetzt ein Thema für 2026. Der günstigste Zeitpunkt, eine unabhängige Review-Schicht einzuführen, lag vor dem Urteil. Der zweitgünstigste liegt vor der Bestätigung durch den BGH.

FAQ zur Chatbot-Haftung

Das Oberlandesgericht Hamm hat am 12. Mai 2026 (Az. 4 UKl 3/25) entschieden, dass Betreiber*innen eines KI-Chatbots vollumfänglich für die falschen Aussagen ihres Bots haften – einschließlich erfundener Facharztbezeichnungen. Rechtlicher Anknüpfungspunkt ist das UWG, das deutsche Gesetz gegen den unlauteren Wettbewerb. Das Gericht hat die Revision zum BGH zugelassen, damit hat das Prinzip einen Weg auf Bundesebene, der weit über die ursprüngliche Beklagte hinausreicht.

Das UWG macht jede erfundene geschäftliche Aussage zu einem Abmahngrund. Sobald ein Gericht Chatbot-Ausgaben als geschäftliche Aussage der Betreiber*innen behandelt, erbt jede Branche, die einen kund*innenseitigen Chatbot betreibt – Handel, Finanzdienstleistung, Gesundheitswesen, Reise – dieselbe Risikoposition wie die Klinik im Fall des OLG Hamm.

Mit einer Bestätigung durch den BGH wird die Betreiberhaftung für KI-Chatbot-Ausgaben in Deutschland zur bindenden Rechtsprechung. Betreiber*innen eines KI-Chatbots, die sich bislang auf Disclaimer oder modellseitige Quellenangaben als Verteidigung verlassen, werden nachweisbare Belege brauchen, dass jeder Output vor der Veröffentlichung geprüft wurde – nicht erst nach einer Beschwerde.

Eine separate KI-Instanz prüft jeden Chatbot-Output gegen die organisationseigenen Regeln. Sie erfasst die faktische Richtigkeit bei heiklen Aussagen, Markenkonformität, regulatorische Grenzen und Tonalität. Sie bewertet jeden Output, fällt eine Freigabe- oder Ablehnungsentscheidung und legt ein prüfbares Protokoll an.

Artikel 50 des EU AI Act tritt im August 2026 in Kraft und verlangt Kennzeichnung sowie prüfbare Nachweise für KI-generierte Outputs. Der Audit Trail, den eine unabhängige Review-Schicht erzeugt, beantwortet die Frage nach der Betreiberhaftung aus dem OLG-Hamm-Urteil und die Dokumentationsfrage aus Artikel 50 im selben Datensatz.

Mehr über künstliche Intelligenz und virtuelle Assistenten

Mann sitzt entspannt auf einem Sofa und schaut auf ein Tablet, im Vordergrund eine überlagerte Shopping-UI mit drei Kopfhörern zur Auswahl, einem „Ask AI Agent"-Button und der Meldung „Found 3 items matching your style"

Agentic Commerce ist in den USA bereits Realität. Drei Protokoll-Lager entscheiden, welche Händler die KI-Agenten als Nächstes wählen.

Nahaufnahme von Händen auf einer Tastatur vor einem Computerbildschirm, auf dem ein CMS-Interface mit einem roten „Not Approved"-Badge, einem SEO-Bereich und einem Sprachauswahlfeld zu sehen ist

75% der neuen Webseiten enthalten KI-Inhalte – die meisten werden ohne Qualitätsprüfung veröffentlicht.

Whitepaper: Wie KI den Handel transformiert

Wie Unternehmen den Sprung von einzelnen KI Use-Cases zu einer ganzheitlichen AI-First-Strategie schaffen.

Whitepaper – Content-Produktion der Zukunft

So können Sie auf Knopfdruck hochwertige Bilder, Texte und Videos in Ihrer Markensprache generieren. Erfahren Sie mehr in unserem Whitepaper.

KI-generierte Models: eine Frau in grauem Pullover und weißer Hose, eine weitere Frau in schwarzer Bluse und schwarzer Hose sowie ein Mann in weißem Pullover und weißer Hose (von links nach rechts)

Mit MOVEX | Virtual Content Creator von one.O ersetzt OTTO klassische Modelfotografie durch KI-generierte Modebilder.

Leuchtturm an der Küste, der allein steht und Orientierung spendet

Entdecken Sie, wie Sie KI-Inhalte erstellen, denen Ihre Kund*innen vertrauen – und hinter denen Ihre Marke stehen kann.

Eine Frau sitzt vor einem Laptop und erstellt mithilfe von KI Videos

Erfahren Sie, wie Einzelhändler und E-Commerce-Marken die passenden KI-Tools für Kampagnen und Storytelling auswählen.

Ein Mann in einem blauen Hemd sitzt auf der Couch, nutzt ein Tablet und genießt das Online-Shopping mit Hilfe eines KI-Assistenten, während im Hintergrund ein Fahrrad steht.

KI-gestützte virtuelle Assistenten verwandeln Kundenfrustration in ein nahtloses Einkaufserlebnis.

Möchten Sie Content-Verifizierung mit KI optimieren?

Unsere Expert*innen beraten Sie gerne. Kontaktieren Sie uns.

Dr. Steffen Tomschke – Business Innovation – Otto Group one.O
Dr. Steffen Tomschke

Business Innovation

Bitte beachte den Disclaimer bezüglich der Nutzung des KI-Assistenten.
Geprüft durch AI Content Verifier.
text bubble Wie kann ich helfen?