Análisis interpretabilidad mecánica de un modelo pequeño

FreeVerified credential4 semanasExpert

Visión general

De qué trata este proyecto.

Analiza un Transformer pequeño con activation patching y logit lens para hallar un circuito causal. Obtén un certificado verificable.

CredentialBlockchain-anchored

ShareableLinkedIn-ready

LanguageEnglish

PaceSelf-paced

El Briefing

Lo que harás y lo que demostrarás.

Replicar un experimento clásico de interpretabilidad mecánica sobre un Transformer pequeño, identificar al menos un circuito y producir un tutorial reproducible.

Earning criteria — what you'll demonstrate

Aplicar técnicas estándar de interpretabilidad mecánica
Validar hipótesis sobre circuitos con intervenciones causales
Reproducir hallazgos publicados con rigor
Producir material reproducible que un nuevo investigador pueda seguir

Encaje académico

Dónde encaja esto en tus estudios.

Afina las mismas habilidades que tu titulación espera de ti.

AI Safety and Alignment

Master · Ai Ml

Fit score: 1

Habilidades

Habilidades que demostrarás.

Cada una aparece en tu credencial verificada.

Carreras

Roles para los que esto te prepara.

Títulos reales. Puentes de habilidades reales. Elige el que más se acerque a tu trayectoria.

Trayectorias profesionales que esto construye

Roles canónicos

Investigador/a de Machine Learning
AI Research

Investigador de Machine Learning

Replicar experimentos de interpretabilidad mecánica y producir material reproducible es trabajo directo de un ML Researcher en safety y alineamiento.

Este proyecto afina

mechanistic-interpretability
transformer-internals
experimental-design

Investigador de Seguridad de IA

La interpretabilidad para safety conecta directamente con el rol de AI Safety Researcher en laboratorios de modelos foundation.

Este proyecto afina

mechanistic-interpretability
deep-learning
scientific-communication

Investigador Científico

Producir tutoriales reproducibles que escalen el conocimiento a nuevas cohortes es competencia diferencial del rol de Research Scientist.

Este proyecto afina

scientific-communication
experimental-design
transformer-internals

Una cosa más

Puedes tener una credencial en tu CV para el viernes.

Empezar este proyecto