Temas principales
Descripción del programa
Empezaremos explorando cómo son los sistemas de IA en general el día de hoy (modelos de fundación) y cómo se podrían llegar a ver en el futuro. Después investigaremos sobre los problemas fundamentales en el alineamiento tales como la especificación incorrecta y la mala generalización de objetivos, algunos ejemplos y cómo estos pueden llevar a resultados inintencionados o incluso catastróficos.
La siguiente mitad del curso cubre cuatro técnicas, las cuáles intentan prevenir el desalineamiento y las limitaciones de estas técnicas, seguido de investigaciones que intentan comprender los sistemas de Machine Learning a un nivel más profundo, incluyendo interpretabilidad y agentes de fundación.
Finalmente, cubriremos dos temas a un alto nivel, gobernanza de la IA y carreras en alineamiento.