Metodologie de hacking pentru sisteme AI
Urmăm o metodologie ofensivă structurată, aliniată cu MITRE ATLAS și OWASP LLM & ML Top 10 (2025). Înainte de testare, definim scope-ul pentru modelele, aplicațiile, pipeline-urile RAG și agenții tăi, și clasificăm taxonomia de atac relevantă.
Recunoaștere & maparea suprafeței de atac AI
Prin OSINT axat pe AI, identificăm și enumerăm assets AI, pipeline-uri de date, modele, vector stores, endpoint-uri și parametri expuși — suprafața de atac pe care un adversar real o mapează prima.
Scanare de vulnerabilități & fuzzing
Evaluare de vulnerabilități și fuzzing specifice AI pe interfețele modelelor, pipeline-uri și deployment-uri, pentru a descoperi proactiv slăbiciunile.
Prompt injection & atacuri pe aplicații LLM
Prompt injection direct și indirect, jailbreaking, scurgerea system prompt-ului, dezvăluirea de informații sensibile și output handling nesigur, pe aplicații LLM reale.
Adversarial ML & confidențialitatea modelului
Atacuri adversariale pe diverse modalități, plus membership inference, model inversion și model extraction pentru a evalua robustețea, încrederea și confidențialitatea.
Atacuri pe date & pipeline-ul de antrenare
Data poisoning și inserare de backdoor/trojan în pipeline-urile de antrenare și integritatea modelului, cu măsuri de protejare a lanțului de date.
Agentic AI & atacuri model-la-model
Exploatarea excesului de agency, abuz cross-LLM și de orchestrare, utilizare greșită de tool-uri/plugin-uri și denial-of-wallet (consum nelimitat de resurse) pe agenți autonomi.
Infrastructură AI & supply chain
Testare ofensivă a framework-urilor AI, pipeline-urilor de deployment, plugin-urilor, API-urilor și dependențelor terțe, urmată de hardening al infrastructurii și lanțului de aprovizionare AI.
Framework-uri & standarde
Ce primești
- Trace-uri de atac reproductibile și exploit-uri proof-of-concept
- Constatări prioritizate, opțional mapate la MITRE ATLAS și OWASP LLM Top 10
- Ghid de hardening pentru guardrails, pipeline-uri RAG și plugin-uri
- Note de pregătire pentru răspuns la incident și forensics AI (add-on)
- Sumar executiv și dovezi pregătite pentru audit (EU AI Act / NIS 2 / DORA)
FAQ
Ce sisteme AI testați?
Aplicații LLM și chatbot-uri, pipeline-uri RAG, sisteme multi-agent/agentice, copiloți și API-uri cu AI — în cloud sau self-hosted.
Aveți nevoie de acces la model?
Testăm black-box prin aplicație/API și, unde e util, grey/white-box cu acces la prompturi, tool-uri și configurația pipeline-ului.
Cum se mapează la conformitate?
Constatările sunt mapate la cerințele de dovezi EU AI Act, NIS 2 și DORA, ca să intre direct în procesul tău de guvernanță și audit.