KI

LLMjacking, und wie man diese Jäger abwehrt

Versuche, KI-Ressourcen zu kapern, nehmen mittlerweile industrielle Maßstäbe an. Wie wird die KI-Infrastruktur angegriffen und welche Abwehrmaßnahmen sind erforderlich?

Stan Kaminsky
27 Mai 2026

KI-Sicherheit hat viele Facetten: Sie muss Datendiebstahl verhindern, betrügerische KI-Agenten bändigen und schädliche Ratschläge von KI-Assistenten erkennen. Eine relativ einfache Bedrohung nimmt immer mehr Fahrt auf: Versuche, die Rechenleistung zu stehlen und fremde neuronale Netzwerke zum eigenen Vorteil auszunutzen. Diese Methode wird als LLMjacking bezeichnet. Da die Prognose einen dramatischen Anstieg der Kosten für KI-Rechenvorgänge voraussagt, wird auch die Zahl der Angreifer wachsen, die auf dieser Welle reiten. Bei der Bereitstellung proprietärer KI-Server und entsprechender Ökosysteme wie RAG oder MCP sind daher von Anfang an strenge Sicherheitsmaßnahmen notwendig.

Statistiken aus einem Honeypot

Wie umfangreich diese Diebstahlversuche sind und welche rasante Entwicklung sie nehmen, veranschaulicht ein Experiment, das im April 2026 ausführlich dokumentiert wurde. Der Forscher konfigurierte einen Raspberry Pi so, dass er sich als leistungsstarker privater KI-Server ausgab, und machte den Server über das Internet zugänglich. Bei Anfragen wurde die Verfügbarkeit der Server Ollama, LM Studio, AutoGPT, LangServe und text-gen-webui gemeldet – Tools, die üblicherweise als Wrapper für lokal gehostete KI-Modelle dienen. Zudem gab der Server vor, API-Anfragen im OpenAI-Format zu akzeptieren, das inzwischen als Branchenstandard gilt.

Alle diese Dienste wurden scheinbar durch eine lokale Instanz von Qwen3-Coder 30B Heretic unterstützt, einem der stärksten Open-Source-Modelle, aus in diesem Fall die Sicherheitsbeschränkung (safety alignment) entfernt wurde. Damit das Ganze noch appetitlicher wirkte, spiegelte der Honeypot-Server das Vorhandensein verschiedener RAG-Datenbanken und eines MCP-Servers mit verlockenden Funktionen wie get_credentials vor.

In Wirklichkeit beherbergte der Raspberry Pi lediglich 500 zuvor gespeicherte Antworten eines echten Qwen3-Modells, wobei ein einfaches Skript jeweils die relevanteste Antwort für eingehende Anfragen herauspickte. Diese Konfiguration genügte, um eine oberflächliche Prüfung zu bestehen, und schon konnte der Forscher die Absichten von Angreifern untersuchen.

Nach Angaben des Forschers entdeckte die populäre Suchmaschine Shodan den Server innerhalb von drei Stunden nach Inbetriebnahme. Schon eine Stunde später gingen Anfragen ein, die offenbar die Funktionen erkunden sollten. Innerhalb des folgenden Monats verarbeitete der Server mehr als 113.000 Anfragen von Tausenden eindeutiger IP-Adressen. Dabei zielten 23 % des Datenverkehrs speziell darauf ab, KI-Funktionen zu finden und lokale LLMs und KI-Agenten auszunutzen.

Mit Anfragen wie /api/tags und /v1/models können Angreifer einen Fingerabdruck erhalten und feststellen, welche Modelle auf einem Server gehostet werden. Ein Scan mit /.cursor/rules deutet gewöhnlich auf einen anschließenden Exploit-Versuch gegen den KI-Agenten hin. Eine Überprüfung mit /.well-known/mcp.json dient der Inventarisierung fremder MCP-Server. Zwar erwähnt der Autor nicht, wie viele Angriffe den Rahmen einer einfachen Überprüfung sprengten. Allein in der letzten Woche des Experiments gab es jedoch 175 aktive Versuche, das LLM zu kapern.

Was wollen die Angreifer?

Laut den Beobachtungen des Forschers versuchte keiner der Angreifer, die sich für den Lockvogel-Server interessierten, irgendwelchen Code auszuführen oder Root-Zugriff zu erhalten. (Anmerkung der Redaktion: Das ist überraschend und könnte auf eine lückenhafte Protokollierung hinweisen.) Fast alle Angriffe hatten das Ziel, Ressourcen abzuzweigen. Während des Experiments wurden beispielsweise folgende Aktivitäten protokolliert:

Ein gut strukturierter Versuch, die technische Dokumentation auf dem Mikroprozessor zu analysieren
Ein Prompt, um einen erotischen Roman zu schreiben
Anfragen zur Analyse und Struktur von Social-Media-Textdaten über neue Schwachstellen
Ein Versuch, den kompromittierten Server als API-Proxy zu verwenden, um Anthropic-Modelle aufzurufen

Bemerkenswert ist, dass zum Scannen von KI-Ressourcen standardisierte Tools eingesetzt werden, die sich rapide weiterentwickeln. Die Anfragen der Anwendung „LLM-Scanner“ stammten aus der Infrastruktur von sieben verschiedenen Cloud-Anbietern in acht Ländern. Ein Hinweis darauf, dass die LMM-Jäger über etablierte Methoden verfügen und ihre Techniken über spezialisierte Plattformen miteinander teilen. Ab der dritten Woche des Experiments nutzte der Scanner eine zusätzliche Überprüfung: Anhand einfacher abstrakter Fragen ermittelte er, ob mit einer Live-KI oder einem Honeypot interagiert wurde, der vorgefertigte Antworten zurückgibt.

Unter den unspezifischen Angriffen verzeichnete das Experiment zahlreiche Versuche, Anmeldeinformationen aus der Datei .env zu extrahieren. Die Angreifer durchsuchten systematisch alle erdenklichen Serververzeichnisse nach dieser Datei. Eine öffentlich zugängliche .env-Datei ist einer der primitivsten Fehler bei der Projektbereitstellung auf Laravel, Node.js und anderen Frameworks. Trotzdem ist dieses Versehen immer noch weit verbreitet – insbesondere unter Anfängern und Vibe-Programmierern. Die Angreifer hatten also gute Gründe, diese Datei aufzuspüren.

Fazit und Tipps zur Verteidigung

Das Scannen und die Ausnutzung öffentlich zugänglicher Server sind ein alter Hut. Mit dem Aufkommen von LLMs bietet sich Angreifern jedoch eine weitere Möglichkeit, ihre unredlichen Bemühungen zu monetarisieren. Diese Methode ist für Kriminelle äußerst lukrativ – und für ihre Opfer verheerend. Wie massiv diese Angriffe werden können, zeigt ein Blick auf den Cryptojacking-Markt. Dort stehlen Kriminelle Rechnerressourcen, um damit Kryptowährungen zu schürfen. Allein im Jahr 2025 wuchs dieser Markt um 20 %. Da sich KI-basierte Lösungen immer mehr verbreiten, die Abokosten der großen Anbieter steigen und lokale KI-Chips knapp bleiben, ist zu erwarten, dass LLMjacking zu einem Phänomen mit industriellem Maßstab wird.

Wichtige Schutzmaßnahmen für eine private KI-Infrastruktur

Für KI-Systeme, die lokal auf einem Computer ausgeführt werden, müssen Server wie LM Studio, Ollama oder ähnliche so konfiguriert werden, dass Verbindungen nur auf der lokalen Schnittstelle (localhost) und nicht auf allen verfügbaren Netzwerkschnittstellen akzeptiert werden. Dadurch wird der LLM-Zugriff auf den Host-Computer eingeschränkt und die KI ist nicht über das Internet erreichbar.
Für Server, die Remote-Anfragen verarbeiten (auch wenn der Server nur innerhalb eines lokalen Unternehmensnetzwerks betrieben wird), solltest du eine robuste Authentifizierung und Autorisierung implementieren. Vertraue nicht ausschließlich auf die Überprüfung des API-Schlüssels. Am effektivsten sind Lösungen, die auf OIDC oder OAuth2 und kurzlebigen Token basieren. Dies schützt nicht nur vor LLMjacking, es ermöglicht auch ein genaueres Tracking der Benutzeraktivitäten und verhindert den Missbrauch von API-Schlüsseln. Gefahr droht übrigens nicht durch externe Angreifer. Ein wachsendes Risiko ist auch der Missbrauch von Schlüsseln durch KI-Agenten. Dies gilt sowohl für LLM-Schnittstellen als auch für MCP, RAG und andere.
Verwende Netzwerksegmentierung und IP-Erlaubnislisten, um den Zugriff auf den KI-Server nur jenen Abteilungen, Mitarbeitern und Diensten zu gewähren, die ihn wirklich benötigen.
Stelle sicher, dass alle Verbindungen zwischen Clients und Servern mit einer aktuellen TLS-Version geschützt sind.
Verwende das Prinzip der geringsten Berechtigungen und einen getrennten Zugriff auf bestimmte Dienste. MCP- und LLM-Komponenten sollten beispielsweise über eigene Zugriffstoken verfügen.
Stelle sicher, dass der EDR-Sicherheitsagent auf allen Workstations und Servern installiert ist. Auch auf jenen, die KI-Modelle hosten.
Überwache den KI-Ressourcenverbrauch, lege Nutzungskontingente für verschiedene Mitarbeiterrollen fest und richte Benachrichtigungen für ungewöhnliche Aktivitätsspitzen ein.
Führe detaillierte Protokolle über LLM-Antworten und Anfragen, die an das Modell und die Zusatztools gestellt wurden. Integriere diese Datenquellen in dein SIEM. Sorge dafür, dass diese Protokolle nicht manipuliert oder unerlaubt gelöscht werden können.

Kaspersky Container Security im praktischen Einsatz

Die Funktionen von Kaspersky Container Security

Wie wir Kaspersky Container Security bei Kaspersky einsetzen und warum es für uns viel mehr ist als ein reiner Image-Scanner

Tipps

Abonnements & Sicherheit: So schützt du deine Konten, deinen Geldbeutel und deine Gesundheit

Wer Abonnements besitzt, sollte sich unbedingt um Cybersicherheit kümmern – um seine eigene und die seiner Familie

In weniger als einer Minute geknackt: (fast) jedes zweite Passwort

Wir haben unsere Studie von vor zwei Jahren über die Möglichkeit, Passwörter aus der realen Welt zu knacken, die im Darknet preisgegeben wurden, überarbeitet. Die Ergebnisse sind ernüchternd: Fast jedes zweite Passwort lässt sich in weniger als einer Minute knacken, bei drei von fünf genügt weniger als eine Stunde. Wie können wir uns von unsicheren Passwörtern frei machen?

Ist dein Sicherheitssystem sicher?

Der Schutz einer Sicherheitskonsole ist wichtiger, als man denkt. Hier erfährst du, wie die Verwaltungsschicht kompromittiert werden kann und wie du dies verhinderst.

Android-Trojaner, die sich als Behördendienste und Starlink-Apps tarnen

BeatBanker – ein Trojanerangriff, der Spionage, Krypto-Diebstahl und Mining mit originellen Methoden kombiniert, um Smartphones zu hacken.

KOSTENLOSE TOOLS

LLMjacking, und wie man diese Jäger abwehrt

Statistiken aus einem Honeypot

Was wollen die Angreifer?

Fazit und Tipps zur Verteidigung

Ungebetene KI auf Unternehmensgeräten deaktivieren

Unerwünschte KI-Tools in Unternehmen – Risiken und Gegenmaßnahmen

Die Funktionen von Kaspersky Container Security

Tipps

Abonnements & Sicherheit: So schützt du deine Konten, deinen Geldbeutel und deine Gesundheit

In weniger als einer Minute geknackt: (fast) jedes zweite Passwort

Ist dein Sicherheitssystem sicher?

Android-Trojaner, die sich als Behördendienste und Starlink-Apps tarnen

LÖSUNGEN FÜR HEIMANWENDER

KLEINE UNTERNEHMEN

MITTLERE UNTERNEHMEN

GROSSE UNTERNEHMEN

Securelist

Eugene Personal Blog

Enzyklopädie