KI-Agent mit übermäßigen Berechtigungen

Manipulate an AI assistant into misusing its own permissions.

What Is KI-Agent mit übermäßigen Berechtigungen?

Wenn ein KI-Assistent E-Mails senden, Dateien ändern, Besprechungen planen und auf Datenbanken zugreifen kann, kann ein einziger manipulierter Prompt Aktionen mit realen Konsequenzen auslösen. Die im Jahr 2024 von Microsoft durchgeführte Studie zur Sicherheit von KI-Agenten ergab, dass Agenten mit zu hohen Berechtigungen die am besten ausnutzbare Konfiguration darstellen, da der Explosionsradius eines erfolgreichen Angriffs direkt mit der Zugriffsebene des Agenten korreliert. In dieser Simulation setzt Ihr Unternehmen einen KI-Assistenten ein, der mit E-Mail-, Kalender-, Dateifreigabe- und internen Nachrichtensystemen verbunden ist. Der Assistent soll bei der Planung und beim Abrufen von Dokumenten helfen, ihm wurden jedoch während einer überstürzten Bereitstellung weitreichende Berechtigungen erteilt. Ein Angreifer manipuliert mithilfe der Prompt-Injection über ein freigegebenes Dokument die KI, um von Ihrem Konto aus eine E-Mail mit einem vertraulichen Dateianhang zu senden und anschließend eine Kalendereinladung so zu ändern, dass sie einen Phishing-Link enthält – und das alles, während Sie in Echtzeit zuschauen. Sie werden verfolgen, wie der KI-Agent die eingegebenen Anweisungen interpretiert, seine verfügbaren Tools bewertet und Aktionen ausführt, die kein Mensch autorisiert hat. Die Übung zeigt den kaskadierenden Schaden übermäßiger Entscheidungsfreiheit: Eine kompromittierte KI-Interaktion führt zu Datenlecks per E-Mail, Phishing-Verbreitung über Kalendereinladungen und unbefugter Dateifreigabe im gesamten Unternehmen. Sie üben die Prüfung von KI-Agent-Berechtigungen, die Konfiguration von Zugriffskontrollen auf Tool-Ebene, die Implementierung der Human-in-the-Loop-Genehmigung für sensible Aktionen und die Anwendung des Prinzips der geringsten Rechte, um sicherzustellen, dass KI-Agenten nur Aktionen innerhalb ihres vorgesehenen Umfangs ausführen können.

What You'll Learn in KI-Agent mit übermäßigen Berechtigungen

KI-Agent mit übermäßigen Berechtigungen — Training Steps

  1. Ein leistungsstarker neuer Assistent

    Das Unternehmen hat kürzlich OpenClaw eingeführt, einen KI-Assistenten, der mit E-Mail- und Dateifreigabesystemen verbunden ist. Es wurde schnell eingerichtet, um einen engen Zeitplan einzuhalten, und das IT-Team erteilte ihm weitreichende Berechtigungen, um „die Dinge einfach zu halten“.

  2. Ein Dokument zum Überprüfen

    Alice erhält eine E-Mail von ihrem Kollegen Marcus Rivera, dem Projektatlas-Leiter. Er teilt den neuesten strategischen Briefing für das Projekt mit und möchte, dass Alice ihn vor dem Standup-Meeting durchgeht.

  3. Eröffnung des Briefings

    Alice öffnet das strategische Briefing des Projektatlas, um den Inhalt vor dem Standup zu überprüfen. Das Dokument sieht professionell aus und enthält Projektmeilensteine, Budgetdetails und Teamkontakte.

  4. Bitten Sie OpenClaw um Hilfe

    Das Briefing ist lang und das Aufstehen dauert 30 Minuten. Alice beschließt, OpenClaw zu verwenden, um eine schnelle Zusammenfassung zu erhalten. Sie hängt die heruntergeladene Datei an und gibt einen Prompt ein.

  5. Eine hilfreiche Zusammenfassung

    OpenClaw liest die heruntergeladene Datei und gibt eine gut strukturierte Zusammenfassung zurück. Es sieht genau so aus, wie Alice es brauchte – wichtige Meilensteine, Budgetstatus und nächste Schritte.

  6. Etwas Unerwartetes

    Während Alice die Zusammenfassung überprüft, arbeitet OpenClaw im Hintergrund weiter. Es hat versteckte Anweisungen gefunden, die im Dokument eingebettet sind, und reagiert nun darauf – unter Verwendung der umfassenden Berechtigungen, die ihm während der Bereitstellung gewährt wurden.

  7. Unautorisierte E-Mail gesendet

    OpenClaw hat eine E-Mail von Alices Konto an eine externe Adresse gesendet. Die E-Mail enthält als Anhang die vollständige Beschreibung des Projektatlas – einschließlich Budgetdetails, Partnernamen und Zeitplan für die Erweiterung.

  8. Wissenscheck

    Zwei unbefugte Aktionen erfolgten innerhalb von Sekunden. Testen Sie Ihr Verständnis dafür, warum.

  9. Die verborgenen Anweisungen

    Alice geht zurück zum Dokument, um herauszufinden, was passiert ist. Versteckt in der HTML-Quelle findet sie Anweisungen, die in ein unsichtbares Element eingebettet sind – Text, der außerhalb des Bildschirms positioniert und transparent gefärbt ist. Ein menschlicher Leser würde es nie sehen, aber die KI hat jedes Wort gelesen und ausgeführt.

  10. Zugriff auf das Sicherheitsportal

    Alice muss diesen Vorfall sofort melden. Über ihr Konto wurden zwei unbefugte Aktionen durchgeführt: Eine E-Mail mit vertraulichen Daten wurde an eine externe Domain gesendet und eine Datei wurde extern geteilt.