Capacidad emergente
Una capacidad emergente es una habilidad que un modelo de IA no muestra en tamaños pequeños y aparece "de repente" cuando el modelo cruza cierto umbral de escala. Modelos de 1.000 millones de parámetros pueden ser incapaces de hacer aritmética; los de 70.000 millones pueden hacerla bien sin que nadie les enseñara explícitamente.
Definición rápida
Una capacidad emergente es una habilidad que un modelo de IA no muestra en tamaños pequeños y aparece "de repente" cuando el modelo cruza cierto umbral de escala. Modelos de 1.000 millones de parámetros pueden ser incapaces de hacer aritmética; los de 70.000 millones pueden hacerla bien sin que nadie les enseñara explícitamente.
Explicación ampliada
Por qué importa para tu empresa
Para una empresa, la idea de capacidad emergente justifica por qué a veces vale la pena pagar por un modelo grande: hay tareas que un modelo de 7B simplemente no hace, no es cuestión de prompting, ni de fine-tuning, ni de paciencia. Razonamiento de varios pasos, comprensión de instrucciones complejas y sensibilidad a matices culturales son ejemplos típicos. La regla práctica: probar el caso de uso en un modelo pequeño primero; si falla, no es seguro que un modelo más grande lo resuelva, pero merece la pena probarlo antes de descartar el caso.
Ejemplo concreto
Una empresa probaba un modelo IA local de 7B parámetros para extraer información de facturas con formatos mixtos. Funcionaba al 60% — fallaba en facturas con cuadros complejos. Asumiendo que el problema era el modelo, probaron uno de 70B: precisión 92%. La diferencia no se podía cubrir con prompting o fine-tuning del 7B; era una capacidad que solo aparecía con la escala. Migraron a la API del modelo grande aunque costaba 8x más por consulta, porque el 32% adicional de aciertos suprimía el trabajo manual de revisión de un FTE.