Off-Policy-Imitation aus Werker-Aufzeichnungen bei Stuttgarter Automotive-Tier-1
Übersicht
Worum es bei diesem Projekt geht.
Du erhaeltst die 18.000 Trajektorien plus ein passendes Sim-Modell der Vor-Montage-Zelle. Implementiere: (1) BC-Baseline auf den vollen Daten, (2) IQL oder CQL als Offline-RL, (3) Eval auf einem realistischen Test-Set in der Sim. Vergleiche Erfolgsrate, Sicherheit (keine Kollisionen mit Werker-Sicherheitszone), und Trainings-Effizienz (Sample-Effizienz). Liefere die Policy-Checkpoints, einen Eval-Bericht und eine Empfehlungs-Notiz fuer das Automatisierungs-Engineering.
Das Briefing
Was Du tust und was Du zeigst.
Trainiere eine Roboter-Policy mit Offline-RL aus 18.000 Werker-Aufzeichnungen und vergleiche gegen Behavior Cloning.
Earning criteria — what you'll demonstrate
- Offline-RL-Methoden (IQL, CQL) verstehen und sinnvoll auf Roboterdaten anwenden
- Trade-off zwischen konservativem Policy-Update und Out-of-Distribution-Risiko quantifizieren
- BC und Offline-RL als zwei Pole eines Spektrums begreifen und ihre Staerken einordnen
- Werker-Daten verantwortlich in Roboter-Verhalten ueberfuehren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenML Researcher
Offline-RL auf einem realen Industriedatensatz mit ehrlicher Sicherheits-Analyse zu trainieren ist eine sehr fortgeschrittene und nachgefragte ML-Researcher-Faehigkeit in Robotik- und Auto-Forschungsgruppen.
Dieses Projekt schärft
- offline-reinforcement-learning
- implicit-q-learning
- behavior-cloning
Research Scientist
Offline-RL-Methoden methodisch zu vergleichen und Sicherheits-Trade-offs quantitativ zu berichten ist Kerngebiet wissenschaftlicher Forschung an Robot Learning.
Dieses Projekt schärft
- conservative-q-learning
- implicit-q-learning
- robot-learning
Applied AI Scientist
Bestehende Werker-Daten in Roboter-Verhalten zu uebersetzen und einem Tier-1-Engineering vorzustellen ist die Tag-eins-Arbeit eines Applied AI Scientists in der Automatisierungsbranche.
Dieses Projekt schärft
- offline-reinforcement-learning
- behavior-cloning
- robot-learning
Noch eine Sache