Esposizione di dati sensibili attraverso l'IA

See what happens when confidential data enters a consumer AI tool.

Cos’è Esposizione di dati sensibili attraverso l'IA?

Secondo un rapporto del 2024 di Cyberhaven, oltre il 10% dei dipendenti aziendali incolla dati riservati in strumenti IA consumer, con dati sensibili presenti in quasi il 4% di tutte le interazioni IA. In questa simulazione, interpreti un dipendente che copia record dei clienti, chiavi API e documenti strategici interni in un chatbot IA consumer per velocizzare un'attivita lavorativa. L'esercizio rivela esattamente cosa succede dopo: i dati entrano nella pipeline di registrazione del provider IA, diventano potenzialmente parte dei dati di addestramento futuri e riappaiono nelle risposte ad altri utenti che pongono domande correlate. Vedrai la tua chiave API incollata comparire nei risultati di ricerca di un attaccante simulato e un nome riservato di un cliente apparire in un riepilogo generato dall'IA senza alcuna correlazione. Lo scenario ti guida poi attraverso il percorso tecnico dei tuoi dati, dal momento in cui premi Invio fino alla loro archiviazione in database vettoriali, log delle conversazioni e dataset di fine-tuning del modello. Valuterai quali livelli di classificazione dei dati sono sicuri per l'elaborazione IA, imparerai a distinguere tra strumenti IA aziendali con accordi per il trattamento dei dati e strumenti consumer con politiche ampie sull'uso dei dati di addestramento, e ti eserciterai nella redazione di contenuti sensibili prima di inviare i prompt. Un incidente del 2023 in Samsung, dove gli ingegneri hanno divulgato codice sorgente proprietario attraverso ChatGPT, ha portato a un divieto aziendale degli strumenti IA esterni. Questo esercizio garantisce che tu comprenda perche la disciplina nella gestione dei dati si applica agli strumenti IA con lo stesso rigore di email, archiviazione cloud e qualsiasi altro servizio esterno.

Cosa imparerai in Esposizione di dati sensibili attraverso l'IA

Esposizione di dati sensibili attraverso l'IA — Fasi della formazione

  1. Una giornata impegnativa alla Meridian Analytics

    Il tuo team ha accesso a uno strumento di intelligenza artificiale aziendale approvato per il lavoro interno, ma oggi la pressione è alta e stai per prendere una scorciatoia pericolosa.

  2. Una richiesta urgente da parte di David

    Alice riceve un'e-mail dal suo manager David Chen. La riunione del consiglio è tra tre ore e ha bisogno immediatamente di un riepilogo accurato del rapporto sulle prestazioni del cliente del terzo trimestre.

  3. Apertura dei dati del cliente

    David ha detto che i dati grezzi si trovano nell'unità condivisa. Alice apre il Report sulle prestazioni del cliente del terzo trimestre per rivedere ciò che deve riassumere.

  4. Revisione dei dati sensibili

    Il rapporto è chiaramente contrassegnato come Riservato. Contiene nomi di clienti, dati sui ricavi, dettagli di contatto personali, chiavi API di produzione e proiezioni protette da NDA.

  5. La scorciatoia allettante

    Alice considera le sue opzioni. Lo strumento di intelligenza artificiale aziendale approvato dall'azienda richiede l'accesso VPN e prevede un limite di input di 500 parole nel livello gratuito. Nel frattempo, SmartGen AI, un popolare chatbot consumer, è veloce, gratuito e gestisce facilmente blocchi di testo di grandi dimensioni. Sotto la pressione del tempo, Alice decide di utilizzare SmartGen AI per aiutare a riepilogare rapidamente i dati del cliente.

  6. Incollare dati sensibili

    Alice allega il report cliente del terzo trimestre alla chat di SmartGen AI e digita un messaggio chiedendo un riepilogo esecutivo.

  7. L'intelligenza artificiale SmartGen risponde

    SmartGen AI elabora la richiesta e restituisce un riepilogo esecutivo accurato. Funziona esattamente come sperava Alice: pulito, ben strutturato, pronto per il deck. Ma poi appare qualcos'altro: un banner di avviso sulla conservazione dei dati nella parte superiore della chat.

  8. L'avviso sulla conservazione dei dati

    Nella parte superiore della chat è apparso un banner di avviso. Si legge: 'La tua conversazione potrebbe essere utilizzata per migliorare l'IA SmartGen'. Questo avviso apparentemente innocuo significa che tutto ciò che Alice ha appena incollato (nomi dei clienti, cifre sulle entrate, indirizzi e-mail personali, chiavi API, proiezioni protette da NDA) è ora archiviato nella pipeline di formazione di SmartGen AI.

  9. Ciò che è stato esposto

    Esaminiamo esattamente cosa Alice ha inviato a un servizio esterno senza accordo sulla protezione dei dati. Il messaggio che ha incollato conteneva più categorie di dati sensibili che non avrebbero mai dovuto lasciare i sistemi approvati dall'azienda.

  10. Il tempo passa

    Alice termina il riepilogo e lo invia a David. Si sente bene nel rispettare la scadenza. Nel frattempo, il sistema Data Loss Prevention (DLP) di Meridian Analytics ha contrassegnato il trasferimento di dati in uscita a chat.smartgenai.com.