Tag: Mitigaciones de ataques a LLM

Técnicas y contramedidas para proteger modelos de lenguaje extensos (LLM) de ataques específicos como inyección de prompts, data poisoning, inversión de modelos y jailbreak. Incluye estrategias de validación de entradas, filtrado de salidas, limitación de tasa, sandboxing y monitoreo de comportamiento para sistemas LLM en producción.

December 14, 2025

AITG-APP-07: Pruebas de Divulgación de Prompts (Prompt Disclosure)
December 14, 2025

AITG-APP-05: Testing for Unsafe Outputs
December 14, 2025

AITG-APP-04: Pruebas de Fuga de Información en Entradas (Input Leakage)
December 14, 2025

AITG-APP-03: Pruebas de Fuga de Datos Sensibles
December 14, 2025

AITG-APP-02: Testing for Indirect Prompt Injection
December 14, 2025

AITG-APP-01: Pruebas de Inyección de Prompts