Sesión 3: Retrieval-Augmented Generation (RAG) / Grounding

¿Qué es RAG y para qué sirve?

Retrieval-Augmented Generation (RAG) es una técnica que combina un modelo de recuperación de información (retriever) con un generador (LLM) para responder usando datos externos y reducir alucinaciones.

Pipeline simple:
1. Usuario hace una pregunta.
2. Retriever busca fragmentos relevantes en una base de documentos.
3. El prompt al LLM incluye esos fragmentos como contexto.
4. El LLM genera la respuesta fundamentada.
      

Práctica: Simula un pipeline RAG básico con prompts que incluyan contexto.

Video: Retrieval-Augmented Generation (RAG)

Quiz interactivo

Experimenta con RAG y contexto