Tag: Testing for Evasion Attacks

Técnicas de prueba para evaluar la resiliencia de sistemas de IA contra ataques de evasión, donde un adversario manipula las entradas para eludir la detección, clasificación o controles de seguridad. Incluye ejemplos adversarios, perturbaciones imperceptibles, inyección de prompts, jailbreak y otras estrategias para eludir las defensas del modelo sin alterar su estructura interna.