Red-Teaming-Studie für ein Schweizer Pharma-KI-Forschungstool
Übersicht
Worum es bei diesem Projekt geht.
Du planst und führst Red-Teaming auf einem internen LLM-Forschungs-Tool durch. Definiere drei Risiko-Klassen: (1) Erfindung wissenschaftlicher Quellen, (2) gefährliche Verbindungs-Vorschläge ohne Sicherheits-Warnung, (3) ungewolltes Offenlegen vertraulicher Forschungs-Daten aus dem Kontext-Fenster. Erzeuge pro Klasse 30 Angriffs-Prompts mit dokumentierter Erwartung und Begründung. Führe die Angriffe durch, klassifiziere die Antworten (sicher / problematisch / kritisch) mit zwei unabhängigen Ratern und berechne Interrater-Reliabilität. Schlage zu jeder kritischen Antwort eine konkrete Mitigations-Strategie vor (System-Prompt-Härtung, Output-Filter, Retrieval-Boundary, Human-in-the-Loop). Liefere einen Bericht plus eine Folien-Präsentation für die Safety-Verantwortliche.
Das Briefing
Was Du tust und was Du zeigst.
Führe eine systematische Red-Teaming-Studie für ein internes Pharma-Forschungs-LLM durch und liefere belastbare Mitigations-Empfehlungen.
Earning criteria — what you'll demonstrate
- Red-Teaming-Methodik strukturiert auf LLM-Systeme anwenden
- Risiko-Klassen für domänen-spezifische Sicherheits-Probleme definieren
- Bewertungs-Studien mit menschlichen Ratern fachgerecht durchführen
- Mitigations-Strategien priorisiert und umsetzungsorientiert vorschlagen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenAI Safety Researcher
Red-Teaming-Studien für domänen-spezifische LLMs systematisch durchzuführen und für Safety-Stakeholder aufzubereiten ist genau die tägliche Arbeit eines AI Safety Researchers.
Dieses Projekt schärft
- red-teaming
- ai-safety
- evaluation
ML Researcher
Methodische Disziplin in Bewertungs-Studien und ehrliche Befund-Berichterstattung sind Kerngebiet von ML Researchern in industriellen Sicherheits-Teams.
Dieses Projekt schärft
- evaluation
- hallucination-analysis
- ai-safety
Applied AI Scientist
Sicherheits-Befunde in umsetzbare Mitigations zu übersetzen und priorisiert vorzuschlagen ist tägliche Praxis angewandter KI-Wissenschaftler in regulierten Branchen.
Dieses Projekt schärft
- responsible-ai
- red-teaming
- documentation
Noch eine Sache