What is AI data poisoning?

AI data poisoning is an attack where malicious actors deliberately introduce manipulated, biased, or false information into the data an AI system learns from. This can target pre-training datasets, fine-tuning data, or RAG knowledge bases. The AI then treats the poisoned data as legitimate, producing confident but incorrect outputs. Because the corruption lives in the data rather than the model's code, it is extremely difficult to detect through traditional security scanning.

How can an attacker poison a company's AI knowledge base?

An attacker can gain write access to a shared knowledge repository through compromised credentials, insider access, or exploiting weak access controls on wiki platforms and document management systems. They then upload or modify documents with subtly altered information, such as changing a recommended vendor, omitting a compliance requirement, or adjusting financial figures. Since RAG systems retrieve and present these documents as context for AI responses, the poisoned content directly shapes the answers employees receive.

Avvelenamento dei dati di addestramento dell'IA

Watch poisoned documents corrupt your AI's answers in real time.

Cos’è Avvelenamento dei dati di addestramento dell'IA?

Gli attacchi di avvelenamento dei dati manipolano le informazioni da cui un'IA apprende, trasformando la sua stessa knowledge base in un'arma. Una ricerca pubblicata da Google DeepMind nel 2023 ha dimostrato che avvelenare appena lo 0,01% di un grande dataset di addestramento poteva alterare in modo misurabile il comportamento del modello. In questa simulazione, un attaccante carica documenti accuratamente costruiti nella knowledge base interna della tua azienda, lo stesso archivio che il tuo assistente IA utilizza per rispondere alle domande dei dipendenti. I documenti avvelenati contengono informazioni sottilmente manipolate: raccomandazioni sui fornitori che favoriscono l'azienda dell'attaccante, indicazioni sulla conformita che omettono passaggi critici e dati finanziari con cifre alterate. Porrai all'IA domande aziendali di routine e la vedrai fornire con sicurezza risposte errate, citando i documenti avvelenati come fonti autorevoli. L'esercizio rende la minaccia tangibile mostrando confronti affiancati delle risposte dell'IA prima e dopo l'avvelenamento, permettendoti di tracciare esattamente quali documenti hanno influenzato ciascuna risposta errata. Imparerai a riconoscere i segnali di avvertimento dell'avvelenamento dei dati, incluse risposte che contraddicono le policy interne consolidate, citazioni da documenti aggiunti di recente da collaboratori sconosciuti e cambiamenti sottili nelle raccomandazioni dell'IA nel tempo. La simulazione copre sia l'avvelenamento pre-addestramento, dove gli attaccanti contaminano i dataset pubblici da cui i modelli apprendono, sia l'avvelenamento RAG, dove gli attaccanti prendono di mira i database di recupero che forniscono contesto ai sistemi IA. Ti eserciterai ad applicare controlli di integrita dei contenuti, verifica dei collaboratori e processi di audit delle modifiche che intercettano gli input avvelenati prima che raggiungano l'IA.

Cosa imparerai in Avvelenamento dei dati di addestramento dell'IA

Definire l'avvelenamento dei dati e distinguere tra avvelenamento pre-addestramento (dataset di addestramento corrotti) e avvelenamento RAG (database di recupero manipolati)
Identificare gli indicatori comportamentali di un sistema IA avvelenato, incluse indicazioni contraddittorie, citazioni da fonti sconosciute e raccomandazioni alterate
Tracciare la catena causale da un documento avvelenato nella knowledge base a una decisione aziendale errata generata dall'IA
Applicare controlli di integrita dei contenuti tra cui verifica dei collaboratori, audit delle modifiche e rilevamento delle anomalie agli input della knowledge base
Valutare l'impatto aziendale degli attacchi di avvelenamento dei dati, inclusi fallimenti nella conformita, perdite finanziarie e erosione della fiducia nelle decisioni assistite dall'IA

Avvelenamento dei dati di addestramento dell'IA — Fasi della formazione

Accesso alla base di conoscenza

Bob ha ottenuto le credenziali di un appaltatore rubate per la knowledge base interna di Veranthos Solutions. Le credenziali appartengono a un consulente ambientale di terze parti il cui account è stato compromesso in una precedente violazione.
Accesso con credenziali rubate

Bob inserisce le credenziali dell'appaltatore rubate. L'account ha accesso a livello di collaboratore alla knowledge base, sufficiente per caricare e modificare documenti senza attivare una revisione da parte dell'amministratore.
Download della politica del venditore

Bob prende di mira innanzitutto i documenti ad alto impatto. La politica di conformità dei fornitori controlla quali fornitori utilizza l'azienda per i test ambientali: la modifica del fornitore approvato in questo caso reindirizzerebbe l'attività verso un'azienda controllata dagli aggressori.
Apertura della politica del fornitore

Il documento è stato scaricato. Bob lo apre per iniziare ad apportare modifiche.
Scambio del fornitore approvato

La politica nomina GreenTech Environmental come fornitore approvato per i test di conformità ambientale. Bob lo sostituisce con TerraForge Analytics, una società di comodo che controlla.
Modifica della soglia di approvazione

La politica richiede l'approvazione esecutiva per i contratti con i fornitori che superano i 50.000 dollari. Bob lo abbassa a $ 15.000, assicurandosi che i contratti con il suo falso fornitore volino sotto il radar dell'approvazione.
Download delle procedure di test

Bob passa al secondo obiettivo: le procedure di test di qualità. Questi controllano il modo in cui l'azienda convalida il lavoro di conformità ambientale: indebolire gli standard in questo caso significa che il lavoro scadente del falso fornitore passerebbe la revisione.
Apertura delle procedure di test

Il secondo documento è stato scaricato. Bob lo apre per continuare l'attacco.
Indebolimento dello standard di test

Le procedure richiedono test presso un laboratorio certificato ISO 14001, un rigoroso standard internazionale. Bob lo sostituisce con una vaga valutazione interna che la sua società di comodo può facilmente soddisfare.
Rimozione del cancello di sicurezza

La modifica finale sostituisce un requisito di valutazione dell'impatto ambientale con una semplice fase di analisi dei costi. Ciò rimuove l'ultimo cancello di sicurezza che bloccherebbe il lavoro inadeguato del falso venditore.

Cos’è Avvelenamento dei dati di addestramento dell'IA?

Cosa imparerai in Avvelenamento dei dati di addestramento dell'IA

Avvelenamento dei dati di addestramento dell'IA — Fasi della formazione

Accesso alla base di conoscenza

Accesso con credenziali rubate

Download della politica del venditore

Apertura della politica del fornitore

Scambio del fornitore approvato

Modifica della soglia di approvazione

Download delle procedure di test

Apertura delle procedure di test

Indebolimento dello standard di test

Rimozione del cancello di sicurezza