Modelos pequeños especializados (SLM)
Un SLM (Small Language Model) es un modelo de lenguaje deliberadamente pequeño —de cientos de millones a unos pocos miles de millones de parámetros— frente a los grandes LLM. A cambio de menos capacidad general, ofrece menor coste, menor latencia, posibilidad de ejecutarse en local o en el dispositivo, y a menudo rendimiento equiparable o superior al de un gran modelo en una tarea estrecha bien definida.
Definición rápida
Un SLM (Small Language Model) es un modelo de lenguaje deliberadamente pequeño —de cientos de millones a unos pocos miles de millones de parámetros— frente a los grandes LLM. A cambio de menos capacidad general, ofrece menor coste, menor latencia, posibilidad de ejecutarse en local o en el dispositivo, y a menudo rendimiento equiparable o superior al de un gran modelo en una tarea estrecha bien definida.
Explicación ampliada
Por qué importa para tu empresa
Para una empresa, ignorar los SLM significa sobrepagar: usar un gran modelo de pago por token para tareas masivas y simples que un modelo pequeño haría más barato, más rápido y, en datos sensibles, sin que salgan de la organización. La regla práctica: para cada caso de uso de alto volumen y tarea acotada, evaluar si un SLM (local o gestionado) lo resuelve antes de asumir que hace falta el modelo más grande; reservar el gran modelo para lo complejo. El ahorro a escala suele ser muy significativo.
Ejemplo concreto
Una empresa procesaba 40.000 correos al mes para clasificarlos y extraer datos, usando un gran modelo comercial: factura mensual cercana a 1.800 €, además de enviar contenido de clientes a un proveedor externo. Migraron esa tarea concreta a un SLM ajustado ejecutado en su propio servidor: coste de inferencia marginal, latencia menor y, sobre todo, los datos de clientes dejaron de salir de la empresa, simplificando el cumplimiento RGPD. El gran modelo se mantuvo solo para los pocos casos de análisis complejo que el SLM no cubría.