El Observatorio de la IA
Ciberaula Observatorio IA Glosario Agentes y automatización RAG (búsqueda aumentada con recuperación)
Agentes y automatización

RAG (búsqueda aumentada con recuperación)

RAG son las siglas en inglés de retrieval-augmented generation, una técnica que combina un LLM con una búsqueda en una base de documentos propia. Antes de responder, el sistema busca los fragmentos más relevantes del repositorio y se los pasa al modelo como contexto. El modelo entonces responde usando esa información concreta, no solo lo que aprendió durante el entrenamiento. Reduce alucinaciones y permite responder sobre datos privados.

Por Ana María González Actualizado: 27 de abril de 2026

Definición rápida

Respuesta directa

RAG son las siglas en inglés de retrieval-augmented generation, una técnica que combina un LLM con una búsqueda en una base de documentos propia. Antes de responder, el sistema busca los fragmentos más relevantes del repositorio y se los pasa al modelo como contexto. El modelo entonces responde usando esa información concreta, no solo lo que aprendió durante el entrenamiento. Reduce alucinaciones y permite responder sobre datos privados.

Explicación ampliada

Un sistema RAG tiene dos componentes. Primero, un buscador semántico (no por palabras clave, sino por significado) que indexa todos los documentos de la empresa: contratos, manuales, actas, normativa interna, base de conocimiento de producto. Segundo, un LLM que recibe la pregunta del usuario junto con los fragmentos más relevantes recuperados del índice. Como el modelo tiene a la vista la información concreta cuando responde, las alucinaciones bajan drásticamente y, además, puede citar de qué documento sale cada afirmación. Es la arquitectura estándar para chatbots empresariales que responden sobre documentación interna, asistentes legales que consultan jurisprudencia, y sistemas de soporte técnico que tiran de manuales propios. Comparado con fine-tuning (otra forma de "darle conocimiento" al modelo), RAG es más barato, más mantenible (basta con actualizar los documentos para que el modelo aprenda), permite control de acceso (cada usuario solo recupera de los documentos a los que tiene permiso) y permite citar fuentes. La calidad de un RAG depende menos del modelo y más de cómo se preparan los documentos: trocearlos en fragmentos del tamaño adecuado, indexarlos bien, y filtrar resultados antes de pasárselos al modelo. Servicios como Microsoft Copilot for M365, Google AgentSpace y plataformas como LangChain o LlamaIndex permiten construir RAGs con complejidad creciente según necesidad.

Por qué importa para tu empresa

Aplicación práctica

Si oyes "queremos que la IA conozca nuestros documentos internos", la respuesta correcta en 2026 es casi siempre RAG, no fine-tuning. Es más barato, más rápido de poner en marcha, más fácil de mantener cuando los datos cambian, y respeta los permisos de acceso. Es el caso de uso de IA empresarial con mejor relación coste-beneficio para la mayoría de pymes con buena documentación.

Ejemplo concreto

Caso real

Una asesoría laboral con 200 convenios colectivos vigentes en sus clientes. Antes, cuando un técnico necesitaba responder una consulta, tardaba 15-20 minutos buscando el convenio aplicable y la cláusula relevante. Con un RAG construido sobre los PDFs de convenios indexados, ahora pregunta "¿cuál es el plus de transporte aplicable en el convenio de comercio del metal de Madrid en 2026?" y obtiene la respuesta con cita directa al artículo del convenio en 5 segundos. El RAG no inventa: si el convenio no contempla algo, responde "no aparece en el documento", que es la respuesta correcta.