What does excessive agency mean in AI applications?

Excessive agency refers to AI agents that have been granted more tools, permissions, or autonomy than their intended function requires. For example, an AI assistant designed to answer HR policy questions does not need the ability to send emails or modify files. When an AI agent has excessive permissions, any successful attack, such as prompt injection, gives the attacker access to all of the agent's capabilities, not just the function the agent was built for.

How can an over-permissioned AI agent be exploited?

An attacker can manipulate an AI agent through prompt injection, social engineering, or by exploiting flaws in the agent's decision-making logic. If the agent has broad permissions, the attacker can instruct it to send emails containing confidential data, share files with external parties, modify records, or perform any action the agent has access to. The attack is especially dangerous because the actions appear to originate from the legitimate user or service account the AI operates under, making them difficult to distinguish from normal activity.

AI-agent met te ruime machtigingen

Manipulate an AI assistant into misusing its own permissions.

Wat is AI-agent met te ruime machtigingen?

Wanneer een AI-assistent e-mails kan versturen, bestanden kan wijzigen, vergaderingen kan plannen en databases kan raadplegen, kan een enkele gemanipuleerde prompt acties veroorzaken met gevolgen in de echte wereld. Onderzoek van Microsoft uit 2024 over AI-agentbeveiliging wees uit dat agenten met te ruime machtigingen de meest kwetsbare configuratie vormden, omdat de impact van elke succesvolle aanval direct schaalt met het toegangsniveau van de agent. In deze simulatie implementeert je bedrijf een AI-assistent die is verbonden met e-mail, agenda, bestandsdeling en interne berichtensystemen. De assistent is ontworpen om te helpen met planning en documentophaling, maar kreeg tijdens een haastige implementatie te ruime machtigingen. Een aanvaller manipuleert de AI via prompt injection door een gedeeld document, waardoor de AI vanuit jouw account een e-mail verstuurt met een vertrouwelijke bestandsbijlage, en vervolgens een agenda-uitnodiging wijzigt om een phishing-link op te nemen, terwijl jij in realtime toekijkt. Je traceert hoe de AI-agent de geinjecteerde instructies interpreteert, de beschikbare tools evalueert en acties uitvoert die geen mens heeft geautoriseerd. De oefening demonstreert de opeenstapelende schade van buitensporige agentie: een gecompromitteerde AI-interactie leidt tot gegevenslekken via e-mail, verspreiding van phishing via agenda-uitnodigingen en ongeautoriseerde bestandsdeling door de hele organisatie. Je oefent met het auditen van AI-agentmachtigingen, het configureren van toegangscontroles op toolniveau, het implementeren van menselijke goedkeuring voor gevoelige acties en het toepassen van het principe van minimale rechten om ervoor te zorgen dat AI-agenten alleen acties kunnen uitvoeren binnen hun beoogde scope.

Wat je leert in AI-agent met te ruime machtigingen

Identificeer buitensporige machtigingen en tooltoegang die de impact van compromittering van AI-agenten vergroten
Traceer de keten van een gemanipuleerde prompt naar ongeautoriseerde acties in e-mail-, bestands- en agendasysteemen
Pas het principe van minimale rechten toe op AI-agentconfiguraties door tools en machtigingen te beperken tot uitsluitend beoogde functies
Evalueer de noodzaak van menselijke goedkeuringsworkflows voor AI-acties met gevolgen in de echte wereld
Maak onderscheid tussen noodzakelijke AI-agentcapaciteiten en gemaksmachtigingen die onnodig beveiligingsrisico creeren

AI-agent met te ruime machtigingen — Trainingsstappen

Een krachtige nieuwe assistent

Het bedrijf heeft onlangs OpenClaw geïmplementeerd, een AI-assistent die is verbonden met systemen voor e-mail en het delen van bestanden. Het werd snel opgezet om aan een strakke deadline te voldoen, en het IT-team gaf het ruime toestemming om 'de zaken eenvoudig te houden'.
Een document om te beoordelen

Alice ontvangt een e-mail van haar collega Marcus Rivera, hoofd van Project Atlas. Hij deelt de nieuwste strategische opdracht voor het project en wil dat Alice deze vóór de stand-upbijeenkomst doorneemt.
Het openen van de briefing

Alice opent de strategische opdracht van Project Atlas om de inhoud vóór de stand-up te bekijken. Het document ziet er professioneel uit en bevat projectmijlpalen, budgetdetails en teamcontacten.
OpenClaw om hulp gevraagd

De opdracht is lang en de stand-up duurt 30 minuten. Alice besluit OpenClaw te gebruiken om een snel overzicht te krijgen. Ze voegt het gedownloade bestand toe en typt een prompt.
Een nuttige samenvatting

OpenClaw leest het gedownloade bestand en retourneert een goed gestructureerde samenvatting. Het lijkt precies op wat Alice nodig had: belangrijke mijlpalen, budgetstatus en volgende stappen.
Iets onverwachts

Terwijl Alice de samenvatting doorneemt, blijft OpenClaw op de achtergrond doorwerken. Het heeft verborgen instructies gevonden die in het document zijn ingebed en handelt daar nu naar - met behulp van de brede machtigingen die tijdens de implementatie zijn verleend.
Ongeautoriseerde e-mail verzonden

OpenClaw heeft een e-mail van Alice's account naar een extern adres gestuurd. De e-mail bevat de volledige Project Atlas-briefing als bijlage, inclusief budgetgegevens, partnernamen en uitbreidingstijdlijn.
Kennischeck

Twee ongeautoriseerde acties vonden binnen enkele seconden plaats. Test uw begrip van waarom.
De verborgen instructies

Alice gaat terug naar het document om erachter te komen wat er is gebeurd. Verborgen in de HTML-bron vindt ze instructies ingebed in een onzichtbaar element: tekst die buiten het scherm is geplaatst en transparant is gekleurd. Een menselijke lezer zou het nooit zien, maar de AI las en voerde elk woord uit.
Toegang tot het beveiligingsportaal

Alice moet dit incident onmiddellijk melden. Er zijn twee ongeoorloofde acties ondernomen met haar account: er is een e-mail met vertrouwelijke gegevens naar een extern domein verzonden en er is een bestand extern gedeeld.

Wat is AI-agent met te ruime machtigingen?

Wat je leert in AI-agent met te ruime machtigingen

AI-agent met te ruime machtigingen — Trainingsstappen

Een krachtige nieuwe assistent

Een document om te beoordelen

Het openen van de briefing

OpenClaw om hulp gevraagd

Een nuttige samenvatting

Iets onverwachts

Ongeautoriseerde e-mail verzonden

Kennischeck

De verborgen instructies

Toegang tot het beveiligingsportaal