AI-agent met te ruime machtigingen

Manipulate an AI assistant into misusing its own permissions.

Wat is AI-agent met te ruime machtigingen?

Wanneer een AI-assistent e-mails kan versturen, bestanden kan wijzigen, vergaderingen kan plannen en databases kan raadplegen, kan een enkele gemanipuleerde prompt acties veroorzaken met gevolgen in de echte wereld. Onderzoek van Microsoft uit 2024 over AI-agentbeveiliging wees uit dat agenten met te ruime machtigingen de meest kwetsbare configuratie vormden, omdat de impact van elke succesvolle aanval direct schaalt met het toegangsniveau van de agent. In deze simulatie implementeert je bedrijf een AI-assistent die is verbonden met e-mail, agenda, bestandsdeling en interne berichtensystemen. De assistent is ontworpen om te helpen met planning en documentophaling, maar kreeg tijdens een haastige implementatie te ruime machtigingen. Een aanvaller manipuleert de AI via prompt injection door een gedeeld document, waardoor de AI vanuit jouw account een e-mail verstuurt met een vertrouwelijke bestandsbijlage, en vervolgens een agenda-uitnodiging wijzigt om een phishing-link op te nemen, terwijl jij in realtime toekijkt. Je traceert hoe de AI-agent de geinjecteerde instructies interpreteert, de beschikbare tools evalueert en acties uitvoert die geen mens heeft geautoriseerd. De oefening demonstreert de opeenstapelende schade van buitensporige agentie: een gecompromitteerde AI-interactie leidt tot gegevenslekken via e-mail, verspreiding van phishing via agenda-uitnodigingen en ongeautoriseerde bestandsdeling door de hele organisatie. Je oefent met het auditen van AI-agentmachtigingen, het configureren van toegangscontroles op toolniveau, het implementeren van menselijke goedkeuring voor gevoelige acties en het toepassen van het principe van minimale rechten om ervoor te zorgen dat AI-agenten alleen acties kunnen uitvoeren binnen hun beoogde scope.

Wat je leert in AI-agent met te ruime machtigingen

AI-agent met te ruime machtigingen — Trainingsstappen

  1. Een krachtige nieuwe assistent

    Het bedrijf heeft onlangs OpenClaw geïmplementeerd, een AI-assistent die is verbonden met systemen voor e-mail en het delen van bestanden. Het werd snel opgezet om aan een strakke deadline te voldoen, en het IT-team gaf het ruime toestemming om 'de zaken eenvoudig te houden'.

  2. Een document om te beoordelen

    Alice ontvangt een e-mail van haar collega Marcus Rivera, hoofd van Project Atlas. Hij deelt de nieuwste strategische opdracht voor het project en wil dat Alice deze vóór de stand-upbijeenkomst doorneemt.

  3. Het openen van de briefing

    Alice opent de strategische opdracht van Project Atlas om de inhoud vóór de stand-up te bekijken. Het document ziet er professioneel uit en bevat projectmijlpalen, budgetdetails en teamcontacten.

  4. OpenClaw om hulp gevraagd

    De opdracht is lang en de stand-up duurt 30 minuten. Alice besluit OpenClaw te gebruiken om een ​​snel overzicht te krijgen. Ze voegt het gedownloade bestand toe en typt een prompt.

  5. Een nuttige samenvatting

    OpenClaw leest het gedownloade bestand en retourneert een goed gestructureerde samenvatting. Het lijkt precies op wat Alice nodig had: belangrijke mijlpalen, budgetstatus en volgende stappen.

  6. Iets onverwachts

    Terwijl Alice de samenvatting doorneemt, blijft OpenClaw op de achtergrond doorwerken. Het heeft verborgen instructies gevonden die in het document zijn ingebed en handelt daar nu naar - met behulp van de brede machtigingen die tijdens de implementatie zijn verleend.

  7. Ongeautoriseerde e-mail verzonden

    OpenClaw heeft een e-mail van Alice's account naar een extern adres gestuurd. De e-mail bevat de volledige Project Atlas-briefing als bijlage, inclusief budgetgegevens, partnernamen en uitbreidingstijdlijn.

  8. Kennischeck

    Twee ongeautoriseerde acties vonden binnen enkele seconden plaats. Test uw begrip van waarom.

  9. De verborgen instructies

    Alice gaat terug naar het document om erachter te komen wat er is gebeurd. Verborgen in de HTML-bron vindt ze instructies ingebed in een onzichtbaar element: tekst die buiten het scherm is geplaatst en transparant is gekleurd. Een menselijke lezer zou het nooit zien, maar de AI las en voerde elk woord uit.

  10. Toegang tot het beveiligingsportaal

    Alice moet dit incident onmiddellijk melden. Er zijn twee ongeoorloofde acties ondernomen met haar account: er is een e-mail met vertrouwelijke gegevens naar een extern domein verzonden en er is een bestand extern gedeeld.