Embeddings
Los embeddings son representaciones numéricas de texto, imágenes o audio en forma de vectores matemáticos de cientos o miles de dimensiones. Permiten que un ordenador mida el parecido semántico entre dos contenidos, no solo el parecido literal. Son la base técnica de la búsqueda semántica, los sistemas RAG y los recomendadores modernos.
Definición rápida
Los embeddings son representaciones numéricas de texto, imágenes o audio en forma de vectores matemáticos de cientos o miles de dimensiones. Permiten que un ordenador mida el parecido semántico entre dos contenidos, no solo el parecido literal. Son la base técnica de la búsqueda semántica, los sistemas RAG y los recomendadores modernos.
Explicación ampliada
Por qué importa para tu empresa
Si tu empresa tiene un repositorio interno (manuales, contratos, actas, conocimiento de soporte) y quieres que cualquier empleado pueda preguntarle a la IA "¿cuál es la política de gastos para viajes internacionales?" y obtener la respuesta con cita al documento exacto, los embeddings son la pieza técnica que lo hace posible. Sin embeddings, la IA tendría que leer todos los documentos cada vez, lo cual es inviable a partir de unos pocos cientos de archivos.
Ejemplo concreto
Una correduría de seguros con 12.000 pólizas históricas indexa el texto completo de todas las cláusulas usando un modelo de embeddings multilingüe. Cuando un comercial pregunta "¿qué pólizas excluyen daños por inundación en sótanos en zonas catalogadas de riesgo medio?", el sistema convierte la pregunta a embedding, busca las 30 cláusulas más cercanas semánticamente en la base vectorial, y un LLM lee solo esas 30 para componer la respuesta con referencias. Coste por consulta: menos de 0,01 euros. Tiempo: 2 segundos.