Infraestructura y técnica

Edge AI / IA en el dispositivo

Edge AI es el despliegue de modelos de IA directamente en dispositivos físicos del usuario —móviles, ordenadores portátiles, dispositivos IoT, cámaras, vehículos— en lugar de en servidores en la nube. Permite respuestas inmediatas, privacidad de los datos y funcionamiento sin conexión.

Por Ana María González Actualizado: 9 de mayo de 2026

Definición rápida

Respuesta directa

Explicación ampliada

Hasta hace poco, la IA potente requería enviar los datos a un servidor remoto, esperar la respuesta y mostrarla. Edge AI invierte el modelo: el modelo se ejecuta donde están los datos. Para que sea posible, los modelos tienen que ser pequeños y eficientes (< 8 GB típicamente), por lo que se usan modelos cuantizados, destilados o diseñados ex profeso para edge. Los hitos relevantes: Apple Intelligence (chips serie M y A17+ con Neural Engine, modelo de ~3B parámetros local en iPhone y Mac), Microsoft Copilot+ PC (chips con NPU >= 40 TOPS, modelo Phi-Silica local), Google AI Edge / Gemini Nano (Pixel y otros Android), modelos optimizados para Snapdragon X Elite. En entorno empresarial: cámaras inteligentes con detección de objetos en local, sensores industriales con clasificación de fallos en planta, terminales de venta con asistente offline, vehículos con asistencia conversacional sin conexión a la nube. Las limitaciones son la calidad —los modelos edge son menos potentes que los frontera de la nube— y el ciclo de actualización —desplegar un modelo nuevo en miles de dispositivos es más complicado que actualizar una API.

Por qué importa para tu empresa

Aplicación práctica

Para una empresa, edge AI cobra sentido cuando se cumplen una o más de estas condiciones: (1) los datos no deben salir del dispositivo (privacidad, cumplimiento sectorial, secreto industrial); (2) la latencia tiene que ser inmediata (decenas de milisegundos, sin esperas de red); (3) el dispositivo opera frecuentemente sin conexión (campo, planta, exterior); (4) el coste a escala de pagar API por cada operación sería prohibitivo. Cuando ninguna de las cuatro aplica, la nube suele ganar por capacidad y simplicidad. Lo más frecuente en empresa real es un híbrido: edge para tareas frecuentes y sensibles, nube para tareas complejas y eventuales.

Ejemplo concreto

Caso real

Una cadena de tiendas de electrodomésticos quería un asistente IA en la app móvil de sus vendedores en planta. Caso de uso: identificar un electrodoméstico fotografiándolo y mostrar su ficha. Probaron primero una solución cloud: cada foto se subía, se procesaba en API y devolvía resultado. Coste por uso: ~0,01 €. Latencia: 3-6 segundos según cobertura del local. Tras 4 meses: 1.300 €/mes en API y vendedores frustrados con las esperas. Migraron a un modelo edge basado en MobileNet entrenado con su catálogo, integrado en la app. Coste: cero por uso, 0,3 segundos de latencia, funciona en sótanos sin cobertura. Inversión inicial: 18.000 €. Amortizado en 14 meses sólo en coste de API.