Sesión 4: RLHF, fine-tuning y calibración de modelos

¿Qué es RLHF?

Ejemplo de experimento RLHF (alto nivel):
1. Entrena un modelo base.
2. Recoge respuestas y pide a humanos que las califiquen.
3. Ajusta el modelo usando esas calificaciones como señal de recompensa.
4. Evalúa mejoras en alineación y seguridad.
      

Práctica: Analiza un caso de uso y diseña un experimento RLHF a alto nivel.

Video: RLHF y calibración de modelos

Quiz interactivo

Experimenta con RLHF y calibración