Aprendizaje supervisado, no supervisado y auto-supervisado
Son los tres grandes paradigmas para entrenar modelos de machine learning. En supervisado el modelo aprende con ejemplos etiquetados (entrada → salida correcta). En no supervisado encuentra patrones sin etiquetas. En auto-supervisado, dominante en LLMs modernos, el modelo se entrena con datos no etiquetados pero crea sus propias etiquetas a partir del propio dato.
Definición rápida
Son los tres grandes paradigmas para entrenar modelos de machine learning. En supervisado el modelo aprende con ejemplos etiquetados (entrada → salida correcta). En no supervisado encuentra patrones sin etiquetas. En auto-supervisado, dominante en LLMs modernos, el modelo se entrena con datos no etiquetados pero crea sus propias etiquetas a partir del propio dato.
Explicación ampliada
Por qué importa para tu empresa
Para una empresa esta distinción importa al evaluar proveedores y propuestas. Cualquier proyecto que diga "vamos a entrenar un modelo supervisado para X" implica etiquetar miles de ejemplos: presupuesto y tiempo significativos, normalmente subestimados. "Auto-supervisado" en el marketing de un proveedor probablemente significa "modelo basado en LLM ajustado", lo que es bueno (no requiere etiquetar) pero no mágico. La regla práctica: si te ofrecen un sistema IA supervisado, pregunta cuántos ejemplos etiquetados necesitarán, quién los etiquetará y cuánto costará; si te ofrecen sistema basado en LLM con fine-tuning, pregunta qué datos van a usar y cómo se han preparado.
Ejemplo concreto
Un fabricante quería un modelo IA para detectar defectos en piezas a partir de cámaras de la línea. Tres consultoras le hicieron propuestas. La consultora A planteó un modelo supervisado clásico (CNN entrenada desde cero), exigía etiquetar ~15.000 imágenes (presupuesto: 35.000 € extra, 4 meses). La consultora B planteó usar un modelo de visión preentrenado (auto-supervisado, abierto) más fine-tuning ligero con 800 imágenes etiquetadas (presupuesto: 8.000 € de etiquetado, 6 semanas). La consultora C planteó usar un modelo multimodal grande (Claude o Gemini con visión) sin entrenar, solo prompt engineering (presupuesto: cero etiquetado, 2 semanas, coste recurrente API). Eligieron la C para piloto y la B para producción tras validar. La diferencia entre paradigmas era el factor 4-10x del coste y del tiempo.