Sesión 3: Retrieval-Augmented Generation (RAG) / Grounding
¿Qué es RAG y para qué sirve?
Retrieval-Augmented Generation (RAG) es una técnica que combina un modelo de recuperación de información (retriever) con un generador (LLM) para responder usando datos externos y reducir alucinaciones.
- ¿Por qué usarlo? Permite respuestas más precisas y fundamentadas, usando contexto real.
- Arquitectura básica: Retriever (busca información relevante) + Reader (genera la respuesta usando ese contexto).
- Embeddings y similarity search: Los textos se convierten en vectores para buscar similitud semántica.
Pipeline simple:
1. Usuario hace una pregunta.
2. Retriever busca fragmentos relevantes en una base de documentos.
3. El prompt al LLM incluye esos fragmentos como contexto.
4. El LLM genera la respuesta fundamentada.
Práctica: Simula un pipeline RAG básico con prompts que incluyan contexto.