El Observatorio de la IA
Ciberaula Observatorio IA Glosario Agentes y automatización Computer use (control del ordenador)
Agentes y automatización

Computer use (control del ordenador)

Computer use es la capacidad de un agente IA para controlar directamente un ordenador como lo haría una persona: ver la pantalla, mover el ratón, hacer clics, escribir en el teclado y rellenar formularios. Permite automatizar tareas en aplicaciones que no tienen API expuesta, navegando interfaces web o de escritorio. Los principales son Claude Computer Use (Anthropic), Project Mariner (Google) y Operator (OpenAI).

Por Ana María González Actualizado: 28 de abril de 2026

Definición rápida

Respuesta directa

Computer use es la capacidad de un agente IA para controlar directamente un ordenador como lo haría una persona: ver la pantalla, mover el ratón, hacer clics, escribir en el teclado y rellenar formularios. Permite automatizar tareas en aplicaciones que no tienen API expuesta, navegando interfaces web o de escritorio. Los principales son Claude Computer Use (Anthropic), Project Mariner (Google) y Operator (OpenAI).

Explicación ampliada

Hasta 2024, automatizar acciones en aplicaciones requería usar su API si la tenían, o herramientas tradicionales de RPA (robotic process automation) que requerían programar paso a paso cada secuencia. Computer use cambia el paradigma: el modelo IA recibe una captura de pantalla, decide qué elemento pulsar o qué escribir basandose en la imagen y el objetivo, y envía instrucciones de teclado y ratón al sistema operativo o al navegador. La acción se ejecuta, llega una nueva captura, y el ciclo se repite. Las implementaciones actuales son tres principales. <strong>Claude Computer Use</strong> (Anthropic, primera versión octubre 2024, en producción con Sonnet 4.6) permite controlar un ordenador entero vía API. <strong>Project Mariner</strong> (Google, en producción con Gemini 3) integrado en el navegador Chrome para navegar webs por instrucción. <strong>Operator</strong> (OpenAI, lanzado enero 2025) es un agente web autónomo en navegador remoto. Microsoft también tiene capacidades parciales en Copilot Studio para automatización de Office. La fiabilidad ha mejorado mucho pero sigue por debajo de las APIs cuando estas existen. Para tareas de pocos pasos en interfaces estables (rellenar un formulario, descargar un fichero, copiar datos entre dos pestañas) la tasa de éxito ronda el 90%. Para tareas largas o interfaces que cambian (sitios web con A/B testing, actualizaciones de UI) la fiabilidad cae rápido. Es tecnología en transición: útil ya en muchos casos, pero requiere supervisión humana para tareas críticas.

Por qué importa para tu empresa

Aplicación práctica

Para una pyme, computer use abre la puerta a automatizar trabajo aburrido en aplicaciones que no tienen API: portales de la administración pública, sistemas legacy de proveedores, aplicaciones SaaS sin integración nativa. Tres reglas prácticas para usarlo en 2026. Primero: empezar por tareas sencillas (rellenar formularios, descargas, comprobaciones). Segundo: nunca dejar al agente actuar sin límites en operaciones que mueven dinero o borran datos. Tercero: planificar fallos: medir tasa de éxito real durante un mes antes de quitar la supervisión humana.

Ejemplo concreto

Caso real

Una asesoría laboral usa Claude Computer Use para una tarea repetitiva: descargar mensualmente las nóminas firmadas digitalmente de cada uno de sus 80 clientes desde el portal de la Seguridad Social (que no tiene API empresarial usable). El agente navega el portal, autentica con certificado digital de la asesoría, recorre la lista de clientes y descarga cada PDF al carpeta correspondiente del NAS. La tarea, que antes ocupaba media jornada del técnico el día 5 de cada mes, ahora corre en 40 minutos sin supervisión y la técnico solo revisa al final que estén los 80 ficheros con el tamaño esperado. Tasa de éxito en los últimos 6 meses: 78 de 80.