Vergiftiging van AI-trainingsgegevens

Watch poisoned documents corrupt your AI's answers in real time.

Wat is Vergiftiging van AI-trainingsgegevens?

Datavergiftigingsaanvallen manipuleren de informatie waar een AI van leert, waardoor de eigen kennisbank een wapen wordt. Onderzoek gepubliceerd door Google DeepMind in 2023 toonde aan dat het vergiftigen van slechts 0,01% van een grote trainingsdataset het modelgedrag meetbaar kon veranderen. In deze simulatie uploadt een aanvaller zorgvuldig samengestelde documenten naar de interne kennisbank van je bedrijf, dezelfde repository die je AI-assistent gebruikt om vragen van medewerkers te beantwoorden. De vergiftigde documenten bevatten subtiel gemanipuleerde informatie: leveranciersaanbevelingen die de voorkeur geven aan het bedrijf van de aanvaller, compliance-richtlijnen die kritieke stappen weglaten, en financiele gegevens met gewijzigde cijfers. Je stelt de AI routinematige zakelijke vragen en kijkt toe hoe deze vol vertrouwen foute antwoorden geeft, onder verwijzing naar de vergiftigde documenten als gezaghebbende bronnen. De oefening maakt de dreiging tastbaar door vergelijkingen naast elkaar te tonen van AI-antwoorden voor en na de vergiftiging, zodat je precies kunt traceren welke documenten elk onjuist antwoord hebben beinvloed. Je leert de waarschuwingssignalen van datavergiftiging herkennen, waaronder antwoorden die in strijd zijn met vastgesteld intern beleid, verwijzingen naar recent toegevoegde documenten door onbekende bijdragers, en subtiele verschuivingen in AI-aanbevelingen in de loop der tijd. De simulatie behandelt zowel pre-training vergiftiging, waarbij aanvallers openbare datasets besmetten waarvan modellen leren, als RAG-vergiftiging, waarbij aanvallers de ophaaldatabases aanvallen die context aan AI-systemen leveren. Je oefent met het toepassen van controles voor inhoudsintegriteit, bijdragerverificatie en wijzigingsaudit die vergiftigde invoer onderscheppen voordat deze de AI bereiken.

Wat je leert in Vergiftiging van AI-trainingsgegevens

Vergiftiging van AI-trainingsgegevens — Trainingsstappen

  1. Toegang tot de kennisbank

    Bob heeft gestolen inloggegevens van aannemers verkregen voor de interne kennisbank van Veranthos Solutions. De inloggegevens behoren toe aan een externe milieuadviseur wiens account bij een eerdere inbreuk is gecompromitteerd.

  2. Inloggen met gestolen inloggegevens

    Bob voert de gestolen inloggegevens van de aannemer in. Het account heeft toegang op contribuantniveau tot de kennisbank – voldoende om documenten te uploaden en te wijzigen zonder een beheerdersbeoordeling te activeren.

  3. Het leveranciersbeleid downloaden

    Bob richt zich eerst op documenten met een grote impact. Het Vendor Compliance Policy bepaalt welke leveranciers het bedrijf gebruikt voor milieutests. Het wijzigen van de goedgekeurde leverancier hier zou de zaken doorverwijzen naar een door aanvallers gecontroleerd bedrijf.

  4. Het leveranciersbeleid openen

    Het document is gedownload. Bob opent het om wijzigingen aan te brengen.

  5. De goedgekeurde leverancier omwisselen

    Het beleid noemt GreenTech Environmental als de goedgekeurde leverancier voor het testen van de naleving van de milieuwetgeving. Bob vervangt het door TerraForge Analytics - een lege vennootschap die hij beheert.

  6. De goedkeuringsdrempel wijzigen

    Het beleid vereist goedkeuring van de uitvoerende macht voor leverancierscontracten van meer dan $ 50.000. Bob verlaagt dit tot $ 15.000, zodat contracten met zijn nepverkoper onder de goedkeuringsradar blijven.

  7. De testprocedures downloaden

    Bob gaat over naar het tweede doel: de kwaliteitstestprocedures. Deze bepalen hoe het bedrijf de naleving van de milieuwetgeving valideert. Het verzwakken van de normen betekent dat het ondermaatse werk van de nepleverancier de beoordeling zou doorstaan.

  8. De testprocedures openen

    Het tweede document is gedownload. Bob opent het om de aanval voort te zetten.

  9. Het verzwakken van de teststandaard

    De procedures vereisen testen in een ISO 14001-gecertificeerd laboratorium - een strenge internationale norm. Bob vervangt het door een vage interne beoordeling waaraan zijn lege vennootschap gemakkelijk kan voldoen.

  10. Het veiligheidshek verwijderen

    De laatste bewerking vervangt een vereiste voor een milieueffectrapportage door een eenvoudige stap voor kostenanalyse. Hiermee wordt het laatste veiligheidshek verwijderd dat het ontoereikende werk van de nepverkoper zou kunnen opvangen.