Modelos de lenguaje (LLM)

Modelos pequeños especializados (SLM)

Un SLM (Small Language Model) es un modelo de lenguaje deliberadamente pequeño —de cientos de millones a unos pocos miles de millones de parámetros— frente a los grandes LLM. A cambio de menos capacidad general, ofrece menor coste, menor latencia, posibilidad de ejecutarse en local o en el dispositivo, y a menudo rendimiento equiparable o superior al de un gran modelo en una tarea estrecha bien definida.

Por Ana María González Actualizado: 16 de mayo de 2026

Definición rápida

Respuesta directa

Explicación ampliada

Durante un tiempo la narrativa fue "más grande siempre es mejor". A partir de 2024-2025 se consolidó una corriente complementaria: para muchas tareas empresariales concretas, un modelo pequeño bien elegido o ajustado iguala o supera a un modelo enorme generalista, a una fracción del coste y la latencia. Un SLM puede correr en infraestructura modesta, incluso on-premise o en un dispositivo, lo que tiene implicaciones directas de privacidad (los datos no salen) y de coste (sin factura por token a un proveedor externo). El SLM no sustituye al gran modelo para tareas que exigen razonamiento amplio, conocimiento general o creatividad abierta; brilla en tareas acotadas y repetitivas: clasificar, extraer campos, enrutar, etiquetar, responder preguntas dentro de un dominio cerrado. La estrategia madura en 2026 no es "un gran modelo para todo" ni "solo modelos pequeños", sino una arquitectura mixta: SLM para el grueso de operaciones rutinarias de alto volumen, y un gran modelo reservado para las consultas que de verdad lo necesitan.

Por qué importa para tu empresa

Aplicación práctica

Para una empresa, ignorar los SLM significa sobrepagar: usar un gran modelo de pago por token para tareas masivas y simples que un modelo pequeño haría más barato, más rápido y, en datos sensibles, sin que salgan de la organización. La regla práctica: para cada caso de uso de alto volumen y tarea acotada, evaluar si un SLM (local o gestionado) lo resuelve antes de asumir que hace falta el modelo más grande; reservar el gran modelo para lo complejo. El ahorro a escala suele ser muy significativo.

Ejemplo concreto

Caso real

Una empresa procesaba 40.000 correos al mes para clasificarlos y extraer datos, usando un gran modelo comercial: factura mensual cercana a 1.800 €, además de enviar contenido de clientes a un proveedor externo. Migraron esa tarea concreta a un SLM ajustado ejecutado en su propio servidor: coste de inferencia marginal, latencia menor y, sobre todo, los datos de clientes dejaron de salir de la empresa, simplificando el cumplimiento RGPD. El gran modelo se mantuvo solo para los pocos casos de análisis complejo que el SLM no cubría.