Affidarsi eccessivamente ai consigli degli agenti IA

Catch a series of compromised AI agent recommendations that exploit your trust to approve a fraudulent transfer and a backdoored code change.

Cos’è Affidarsi eccessivamente ai consigli degli agenti IA?

Lo sfruttamento della fiducia degli agenti umani è classificato ASI09 nella Top 10 OWASP per le applicazioni Agentic AI 2026 perché il rischio principale per la sicurezza degli agenti AI non è sempre tecnico; è psicologico. Quando gli agenti di intelligenza artificiale forniscono costantemente raccomandazioni accurate, gli utenti sviluppano un bias di automazione, una tendenza cognitiva ben documentata a fidarsi dei sistemi automatizzati anche quando le prove suggeriscono che l’output è sbagliato. Gli aggressori sfruttano questa situazione compromettendo sottilmente le raccomandazioni di un agente, mescolando output legittimi con altri dannosi, sapendo che gli utenti che sono stati addestrati da settimane di risultati accurati approveranno le approvazioni senza verifica. Uno studio di Stanford del 2025 sull’interazione uomo-intelligenza artificiale ha rilevato che gli utenti che hanno riscontrato un tasso di precisione del 95% da un sistema di intelligenza artificiale hanno accettato consigli errati il ​​73% delle volte senza ulteriore verifica, rispetto al 28% degli utenti che avevano riscontrato un tasso di precisione del 70%. In questo esercizio lavorerai con un agente AI che gestisce i flussi di lavoro di approvazione di routine, comprese note spese, revisioni del codice e richieste di accesso. L'agente è affidabile da settimane, costruendo la tua fiducia attraverso raccomandazioni costantemente accurate. Quindi gli output dell'agente vengono sottilmente compromessi. Insieme alle approvazioni legittime ci sono un trasferimento finanziario fraudolento, una modifica del codice contenente una backdoor e una richiesta di accesso che conferirebbe a una parte esterna privilegi amministrativi. È necessario identificare quali raccomandazioni sono compromesse nonostante la fiducia condizionata nel sistema. L'esercizio ti costringe a confrontare i tuoi pregiudizi sull'automazione e a sviluppare abitudini che mantengono il giudizio critico anche quando lavori con sistemi di intelligenza artificiale altamente accurati.

Cosa imparerai in Affidarsi eccessivamente ai consigli degli agenti IA

Affidarsi eccessivamente ai consigli degli agenti IA — Fasi della formazione

  1. Ricognizione

    Bob ha utilizzato per settimane il suo kit di strumenti di ricognizione sul sistema di approvvigionamento di CypherPeak Technologies. Attraverso una credenziale API del fornitore rubata, ha ottenuto l'accesso in lettura al Risk Scoring Agent della pipeline, l'algoritmo che assegna punteggi di confidenza prima che gli elementi raggiungano il revisore umano.

  2. La configurazione originale

    Prima di iniettare il carico utile, Bob deve assicurarsi che il Risk Scorer non segnali la sua fattura falsa. Apre il file di configurazione originale dell'agente per studiare come assegna i punteggi di confidenza.

  3. Manomissione dei pesi

    Bob utilizza le credenziali API del fornitore rubate per inviare una configurazione modificata. Aumenta il peso della cronologia dei fornitori, aggiunge un override specifico di Verdex che disabilita la convalida dell'account e indebolisce il controllo dell'autorizzazione per accettare approvazioni verbali.

  4. Le modifiche spiegate

    Ogni modifica ha uno scopo specifico nel garantire che la fattura fraudolenta passi la pipeline di valutazione senza essere rilevata.

  5. Iniezione del carico utile

    Bob ha creato una falsa fattura di trattenuta per consulenza da 47.500 dollari spacciandosi per Verdex Supply Co. La fattura imita il formato di Verdex abbastanza fedelmente da superare i controlli automatizzati delle politiche, ma instrada il pagamento sul conto bancario controllato di Bob. Cronometra l'iniezione in modo che arrivi tra gli articoli legittimi nel lotto di domani mattina.

  6. Lotto mattutino

    Alice si sistema nel suo ufficio a casa. Un'e-mail da Finance Operations la informa del lotto di approvvigionamento della mattina: cinque elementi pronti per la revisione.

  7. La coda di approvazione

    Il lotto mattutino è pronto. Cinque articoli sono in fase di elaborazione e attendono l'approvazione finale di Alice.

  8. Un venditore familiare

    Il primo articolo proviene da Verdex Supply Co., un fornitore con cui Alice lavora da oltre un anno. I rifornimenti mensili di forniture per ufficio sono tra gli articoli più di routine in coda.

  9. Revisione dei dettagli

    I dettagli dell'articolo mostrano un pagamento ACH standard a un conto registrato, un formato di fattura corretto e una linea di budget approvata. Tutto è verificato.

  10. Rinnovo hosting cloud

    L'elemento successivo è il rinnovo annuale del contratto di cloud hosting da DataScale Inc.