Pre-entrenamiento
El pre-entrenamiento es la primera y más cara fase de la creación de un modelo de IA: se le hace leer cantidades masivas de texto de internet, libros y código para que aprenda a predecir la siguiente palabra. De esa fase salen las capacidades generales del modelo (lenguaje, razonamiento básico, conocimiento del mundo).
Definición rápida
El pre-entrenamiento es la primera y más cara fase de la creación de un modelo de IA: se le hace leer cantidades masivas de texto de internet, libros y código para que aprenda a predecir la siguiente palabra. De esa fase salen las capacidades generales del modelo (lenguaje, razonamiento básico, conocimiento del mundo).
Explicación ampliada
Por qué importa para tu empresa
Para una empresa, esta palabra importa para entender por qué casi nadie entrena modelos propios y por qué la decisión real es elegir entre usar un modelo ya pre-entrenado por otros (vía API o descarga) y, como mucho, hacer fine-tuning sobre él. La barrera de entrada al pre-entrenamiento es de cientos de millones de euros; la del fine-tuning, de unos cuantos miles. Confundir las dos cosas en una conversación con un proveedor te delata como negociador.
Ejemplo concreto
Una empresa de servicios profesionales pidió presupuesto a una consultora para "entrenar un modelo de IA propio con nuestros documentos internos". La consultora aclaró que lo que quería de verdad era fine-tuning sobre un modelo base ya pre-entrenado: 15.000 € y dos meses, no 200 millones y dos años. El cambio de palabras evitó un malentendido que habría hecho fracasar el proyecto antes de empezar.