Agentes y automatización

Sandbox de ejecución (para agentes IA)

Un sandbox de ejecución es un entorno aislado donde un agente IA puede ejecutar código, comandos o llamadas a herramientas sin afectar al sistema real. Es esencial para agentes con capacidad de actuar (escribir archivos, ejecutar scripts, hacer llamadas API): el sandbox limita lo que pueden romper si se equivocan o si son atacados.

Por Ana María González Actualizado: 9 de mayo de 2026

Definición rápida

Respuesta directa

Explicación ampliada

Cuando un agente IA tiene capacidad de actuar (function calling, computer use, code execution), se vuelve potente pero también peligroso: si el modelo interpreta mal una instrucción o sufre inyección de prompt, puede ejecutar acciones destructivas (borrar archivos, vaciar bases de datos, hacer pagos no autorizados). El sandbox es el confinamiento. Implementaciones típicas: contenedor Docker o microVM aislado del sistema host con permisos mínimos; entorno serverless efímero que se destruye al terminar; sistema de archivos virtual con sólo lectura excepto en una carpeta temporal; restricción de salida de red a hosts de una whitelist; tiempo máximo de ejecución por llamada. Servicios comerciales que ofrecen esto: Anthropic Code Execution Tool (Python en sandbox aislado), OpenAI Code Interpreter, Modal, E2B, Daytona, AWS Lambda como sandbox para agentes. Para casos serios de empresa, los agentes con capacidad de modificar sistemas reales deben pasar por una capa de sandbox con auditoría: cada acción que el agente quiere hacer queda registrada y, en operaciones críticas, requiere confirmación humana antes de salir del sandbox al sistema real.

Por qué importa para tu empresa

Aplicación práctica

Para una empresa, el sandbox es la diferencia entre desplegar un agente experimental en interno y desplegar uno profesional con consecuencias en sistemas reales. Sin sandbox, cada acción del agente puede ser destructiva irreversible; con sandbox + revisión, los errores se detectan antes de aplicarse. La regla práctica: si el agente toca sistemas con datos reales (CRM, ERP, pagos, comunicaciones a clientes), exigir sandbox + log + revisión humana de operaciones por encima de cierto umbral. Si el agente solo lee y propone, el sandbox puede ser más laxo.

Ejemplo concreto

Caso real

Una empresa de marketing automatizado desplegó un agente que preparaba campañas de email: redactaba, segmentaba la lista, programaba el envío. Inicialmente con acceso directo al sistema de envíos. Al segundo mes, un prompt mal interpretado hizo que enviara una campaña de prueba a la lista completa de 80.000 contactos en lugar de a la de prueba. Daño: 80.000 emails con texto incompleto y enlaces rotos enviados, alta tasa de bajas, queja del cliente. Tras el incidente añadieron sandbox: el agente prepara la campaña en un sistema de staging, los envíos por encima de 500 destinatarios requieren aprobación humana de un responsable, y todo queda registrado. Cero incidentes desde entonces; ligero coste de fricción operativa, retorno enorme en seguridad.