Coste por token (input/output)
El coste por token es lo que un proveedor de IA cobra por cada millón de tokens de entrada (input) y de salida (output) que procesa un modelo. Es la métrica fundamental para presupuestar IA en empresa: dos modelos pueden tener calidad parecida pero diferir 5-10x en coste, y los precios del input y del output suelen ser muy distintos.
Definición rápida
El coste por token es lo que un proveedor de IA cobra por cada millón de tokens de entrada (input) y de salida (output) que procesa un modelo. Es la métrica fundamental para presupuestar IA en empresa: dos modelos pueden tener calidad parecida pero diferir 5-10x en coste, y los precios del input y del output suelen ser muy distintos.
Explicación ampliada
Por qué importa para tu empresa
Para una empresa, el cálculo correcto antes de adoptar un caso de uso a escala es: tokens promedio por petición × peticiones al mes × precio del modelo. La trampa típica es subestimar el output (porque cuesta más): si una petición media usa 2.000 tokens de input pero el modelo responde con 500 tokens, en Sonnet 4.6 el output ($15/M × 500 = $0.0075) cuesta más que el input ($3/M × 2.000 = $0.006). Otro error frecuente: contar tokens "como palabras". En español, multiplica por 1,3-1,5 lo que estimes. Y a la hora de comparar proveedores, siempre comparar sobre tu carga real con tus prompts, no sobre cifras de marketing.
Ejemplo concreto
Un servicio de atención al cliente con 30.000 tickets/mes contemplaba usar IA para borradores de respuesta. Estimación inicial: 1.500 tokens input + 400 output por ticket. En Sonnet 4.6: (45 M × $3) + (12 M × $15) = $135 + $180 = $315/mes. Mismo cálculo en Haiku 4.5: (45 M × $1) + (12 M × $5) = $45 + $60 = $105/mes. Probaron ambos, Haiku daba calidad suficiente para el 70% de tickets sencillos. Diseñaron un enrutador: Haiku para los simples, Sonnet solo para los complejos. Coste mensual real: ~$140. Ahorro vs usar siempre Sonnet: 55%. Misma calidad percibida.