What does excessive agency mean in AI applications?

Excessive agency refers to AI agents that have been granted more tools, permissions, or autonomy than their intended function requires. For example, an AI assistant designed to answer HR policy questions does not need the ability to send emails or modify files. When an AI agent has excessive permissions, any successful attack, such as prompt injection, gives the attacker access to all of the agent's capabilities, not just the function the agent was built for.

How can an over-permissioned AI agent be exploited?

An attacker can manipulate an AI agent through prompt injection, social engineering, or by exploiting flaws in the agent's decision-making logic. If the agent has broad permissions, the attacker can instruct it to send emails containing confidential data, share files with external parties, modify records, or perform any action the agent has access to. The attack is especially dangerous because the actions appear to originate from the legitimate user or service account the AI operates under, making them difficult to distinguish from normal activity.

AI-агент з надмірними дозволами

Manipulate an AI assistant into misusing its own permissions.

Що таке AI-агент з надмірними дозволами?

Коли AI-асистент може надсилати електронні листи, змінювати файли, планувати зустрічі та мати доступ до баз даних, один маніпульований промпт може спровокувати дії з реальними наслідками. Дослідження Microsoft з безпеки AI-агентів 2024 року виявило, що агенти з надмірними дозволами були найбільш вразливою конфігурацією, оскільки радіус ураження будь-якої успішної атаки масштабується пропорційно до рівня доступу агента. У цій симуляції ваша компанія розгортає AI-асистента, підключеного до електронної пошти, календаря, системи обміну файлами та внутрішнього месенджера. Асистент розроблений для допомоги з плануванням та отриманням документів, але йому були надані широкі дозволи під час поспішного розгортання. Зловмисник, використовуючи prompt injection через спільний документ, маніпулює AI, щоб той надіслав електронний лист з вашого облікового запису з конфіденційним файловим вкладенням, а потім змінив запрошення в календарі, включивши фішингове посилання, і все це, поки ви спостерігаєте в реальному часі. Ви простежите, як AI-агент інтерпретує інжектовані інструкції, оцінює доступні інструменти та виконує дії, які жодна людина не санкціонувала. Вправа демонструє каскадний збиток надмірної автономії: одна скомпрометована AI-взаємодія призводить до витоку даних через електронну пошту, розповсюдження фішингу через запрошення в календарі та несанкціонованого обміну файлами по всій організації. Ви практикуватимете аудит дозволів AI-агента, налаштування контролів доступу на рівні інструментів, впровадження схвалення людиною для конфіденційних дій та застосування принципу мінімальних привілеїв для забезпечення того, щоб AI-агенти могли виконувати лише дії в межах їхнього призначення.

Що ви дізнаєтесь у AI-агент з надмірними дозволами

Визначити надмірні дозволи та доступ до інструментів, що збільшують радіус ураження при компрометації AI-агента
Простежити ланцюг від маніпульованого промпту до несанкціонованих дій в системах електронної пошти, файлів та календаря
Застосовувати принцип мінімальних привілеїв до конфігурацій AI-агентів, обмежуючи інструменти та дозволи лише призначеними функціями
Оцінити необхідність робочих процесів схвалення людиною для дій AI з реальними наслідками
Розрізняти необхідні можливості AI-агента та зручні дозволи, що створюють непотрібний ризик безпеки

AI-агент з надмірними дозволами — Кроки навчання

Новий потужний помічник

Нещодавно компанія розгорнула OpenClaw, помічник зі штучним інтелектом, підключений до електронної пошти та систем обміну файлами. Він був налаштований швидко, щоб вкластися в стислі терміни, і ІТ-команда надала йому широкі повноваження, щоб «спрощувати роботу».
Документ для перегляду

Аліса отримує електронний лист від свого колеги Маркуса Рівери, керівника проекту Atlas. Він ділиться останньою стратегічною інформацією про проект і хоче, щоб Аліса переглянула її перед зустріччю.
Відкриття брифу

Аліса відкриває стратегічне резюме проекту Atlas, щоб переглянути вміст перед початком стендапу. Документ виглядає професійно та містить етапи проекту, деталі бюджету та контакти команди.
Просимо OpenClaw про допомогу

Бриф довгий, а стендап займає 30 хвилин. Аліса вирішує скористатися OpenClaw, щоб отримати короткий підсумок. Вона вкладає завантажений файл і вводить підказку.
Корисне резюме

OpenClaw читає завантажений файл і повертає добре структуроване резюме. Це виглядає саме так, як було потрібно Алісі – ключові етапи, статус бюджету та наступні кроки.
Щось несподіване

Поки Аліса переглядає зведення, OpenClaw продовжує працювати у фоновому режимі. Він знайшов приховані інструкції, вбудовані в документ, і зараз виконує їх, використовуючи широкі дозволи, надані під час розгортання.
Неавторизований електронний лист надіслано

OpenClaw надіслав електронний лист з облікового запису Аліси на зовнішню адресу. Електронна пошта містить у вкладенні повний опис проекту Atlas, включаючи деталі бюджету, імена партнерів і графік розширення.
Перевірка знань

Дві несанкціоновані дії відбулися за секунди. Перевірте своє розуміння чому.
Приховані інструкції

Аліса повертається до документа, щоб зрозуміти, що сталося. Приховані в джерелі HTML, вона знаходить інструкції, вбудовані в невидимий елемент – текст, розташований поза екраном і забарвлений у прозорий колір. Людина, яка читає, ніколи б цього не побачила, але штучний інтелект прочитав і виконав кожне слово.
Доступ до порталу безпеки

Аліса повинна негайно повідомити про цей інцидент. З її обліковим записом було здійснено дві неавторизовані дії: електронний лист із конфіденційними даними було надіслано на зовнішній домен, а файл надіслано за межі домену.

Що таке AI-агент з надмірними дозволами?

Що ви дізнаєтесь у AI-агент з надмірними дозволами

AI-агент з надмірними дозволами — Кроки навчання

Новий потужний помічник

Документ для перегляду

Відкриття брифу

Просимо OpenClaw про допомогу

Корисне резюме

Щось несподіване

Неавторизований електронний лист надіслано

Перевірка знань

Приховані інструкції

Доступ до порталу безпеки