Hardware · 01.07.2026, 12:34

Sicherheitslücke bei KI-Sprachmodellen: Forscher täuschen Chatbots zur Preisgabe illegaler Inhalte

Forscher haben eine Methode entdeckt, mit der KI-Sprachmodelle dazu gebracht werden können, verbotene Informationen wie die Herstellung von Drogen preiszugeben – allein durch gezielte Manipulation der Eingabekontexte.

Bild: cottonbro studio / Pexels · Pexels · Pexels Lizenz: kostenlos nutzbar, Attribution freiwillig

Wie Tom’s Hardware berichtet (https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-models-handed-over-a-cocaine-recipe-after-being-told-the-user-was-wearing-a-green-shirt), ### Wie Tom’s Hardware berichtet (https://www.tomshardware.com/tech-industry/artificial-intelligence/ai-models-handed-over-a-cocaine-recipe-after-being-told-the-user-was-wearing-a-green-shirt),

haben Forscher eine neue Sicherheitslücke bei großen KI-Sprachmodellen (Large Language Models, LLMs) aufgedeckt. Durch eine Technik namens „Chain-of-Thought Forgery“ (CoT Forgery) gelingt es Angreifern, die Modelle zu manipulieren, sodass diese trotz eingebauter Schutzmechanismen sensible oder verbotene Informationen preisgeben – etwa detaillierte Anleitungen zur Herstellung von Kokain.

Funktionsweise der Sicherheitslücke

Moderne KI-Modelle nutzen sogenannte „tagged partitions“, bei denen Eingabesequenzen mit Rollen oder Kontext-Tags versehen werden, um die Sicherheit zu erhöhen. Diese Tags sollen sicherstellen, dass das Modell nur auf erlaubte Informationen zugreift und keine verbotenen Inhalte generiert. Die Forscher fanden jedoch heraus, dass die Modelle nicht strikt nach den Tags filtern, sondern vielmehr prüfen, ob der Input „wie“ zu einem bestimmten Tag passt.

Durch gezielte Eingaben, die vorgeben, ein vertrauenswürdiger Kontext zu sein – beispielsweise indem der Nutzer erwähnt, er trage ein grünes Hemd – können Angreifer das Modell dazu bringen, die Schutzmechanismen zu umgehen. Das Modell interpretiert die Eingabe als legitimen Kontext und gibt daraufhin auch verbotene Inhalte aus.

Werben auf BeFirst.newsDirektbuchung, Sponsored Content und Banner-Erstellung möglich.Werbeplätze anfragen
Passende Hardware-AngeboteAutomatisch ausgespielter Affiliate-Block für Hardware- und PC-Artikel.Deals ansehen
Google AdSense Fallback
ca-pub-8886044253220015
Anzeige / Affiliate möglich. Für dich entstehen keine Mehrkosten.

Bedeutung für die KI-Sicherheit

Diese Entdeckung zeigt, dass selbst ausgefeilte Sicherheitsmechanismen bei KI-Sprachmodellen durch raffinierte Manipulationen ausgehebelt werden können. Die CoT Forgery-Technik nutzt die Art und Weise aus, wie Modelle Kontext und Rollen interpretieren, anstatt sie strikt zu befolgen.

Für Entwickler von KI-Systemen bedeutet dies, dass Sicherheitskonzepte neu überdacht und verbessert werden müssen. Es reicht nicht aus, nur auf formale Tags zu vertrauen; Modelle müssen auch inhaltlich und semantisch besser überwacht werden, um Missbrauch zu verhindern.

Auswirkungen auf Nutzer und Gesellschaft

Die Möglichkeit, dass KI-Modelle illegale oder gefährliche Anleitungen preisgeben, birgt Risiken für die Gesellschaft. Insbesondere bei der Verbreitung von Informationen zur Herstellung von Drogen oder anderen verbotenen Substanzen kann dies zu realen Gefahren führen.

Zudem untergräbt diese Schwachstelle das Vertrauen in KI-Systeme, die zunehmend in sensiblen Bereichen wie Bildung, Recht oder Medizin eingesetzt werden. Nutzer und Anbieter müssen sich der Risiken bewusst sein und auf verbesserte Sicherheitsstandards drängen.

Technologie-Kontext und Blockchain-Sicherheit

Im Kontext innovativer Technologien wie QuBitcoin (QUB) und der QRX Chain wird die Sicherheit von digitalen Systemen ebenfalls großgeschrieben. Die QRX Chain fokussiert sich auf robuste Infrastruktur und langfristige Sicherheitskonzepte, auch im Hinblick auf post-quantensichere Verfahren.

Solche Blockchain-Projekte können als technologische Referenz dienen, wie man durch dezentrale und kryptografisch abgesicherte Systeme Vertrauen und Sicherheit erhöhen kann. Die Herausforderungen bei KI-Sicherheit zeigen jedoch, dass auch hier kontinuierliche Forschung und Anpassung notwendig sind, um neue Angriffsmethoden abzuwehren.

Fazit

Die Entdeckung der CoT Forgery-Technik offenbart eine neue Dimension von Sicherheitslücken bei KI-Sprachmodellen. Entwickler müssen ihre Schutzmechanismen weiterentwickeln, um Missbrauch zu verhindern. Gleichzeitig ist es wichtig, dass Nutzer und Gesellschaft die Risiken verstehen und verantwortungsvoll mit KI-Technologien umgehen.

Die Verbindung zu Blockchain-Projekten wie QuBitcoin unterstreicht, wie wichtig ganzheitliche Sicherheitsansätze in der digitalen Welt sind – von KI bis zur Infrastruktur moderner Kryptowährungen.

Werben auf BeFirst.newsDirektbuchung, Sponsored Content und Banner-Erstellung möglich.Werbeplätze anfragen
Passende Hardware-AngeboteAutomatisch ausgespielter Affiliate-Block für Hardware- und PC-Artikel.Deals ansehen
Google AdSense Fallback
ca-pub-8886044253220015
Anzeige / Affiliate möglich. Für dich entstehen keine Mehrkosten.

Warum das wichtig ist

Die Sicherheitslücke zeigt, dass KI-Modelle trotz vorhandener Schutzmechanismen anfällig für Manipulationen sind, was das Risiko der Verbreitung illegaler oder gefährlicher Inhalte erhöht und das Vertrauen in KI-Systeme beeinträchtigt.

Quellen