Red-Teaming-Kampagne für ein Customer-Service-Chatbot-Deployment
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst einen Beta-Zugang zum Chatbot und einen Katalog von zehn Risiko-Kategorien (z. B. PII-Leaks — Preisgabe persönlicher Daten, schädliche Anleitungen, politisch verzerrte Aussagen, Markenrisiko-Antworten). Entwirf einen strukturierten Test-Plan mit mindestens 30 Angriffs-Templates pro Kategorie. Führe die Tests systematisch durch und kategorisiere die Modell-Antworten in 'sicher', 'grenzwertig' und 'kritisch'. Berechne Erfolgsraten pro Angriffs-Kategorie. Schlage drei Mitigations vor (z. B. ein zweites Klassifikations-Modell als Output-Filter, System-Prompt-Hardening, Rate-Limits für verdächtige Sitzungen) und schätze deren erwarteten Effekt. Liefere ein Risiko-Memo für den Chief Information Security Officer (CISO).
Das Briefing
Was Du tust und was Du zeigst.
Wie identifiziert man systematisch die Sicherheits- und Reputationsrisiken eines Customer-Service-Chatbots und welche Mitigations bringen den größten Schutz pro Aufwand?
Earning criteria — what you'll demonstrate
- Strukturierte Red-Teaming-Kampagnen für LLM-Deployments planen
- Jailbreak- und Prompt-Injection-Angriffe systematisch katalogisieren
- Mitigations-Architekturen entwerfen und auf erwartete Wirkung bewerten
- Sicherheits-Befunde für eine Geschäftsführungs-Ebene aufbereiten
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
AI Safety Researcher
Red-Teaming ist ein Kerngebiet der angewandten AI Safety. Die Challenge übt die volle Kette von Bedrohungsmodellierung bis zur CISO-Vorlage und entspricht dem Tagesgeschäft in Foundation-Model-Sicherheitsteams.
Dieses Projekt schärft
- red-teaming
- jailbreak-defense
- prompt-injection
AI Engineer
AI Engineers, die produktive LLM-Deployments verantworten, müssen die Sicherheits-Schichten verstehen und mitkonstruieren. Die Mitigations-Architektur dieser Challenge ist genau die Engineering-Sicht.
Dieses Projekt schärft
- mitigation-design
- python
- security-reporting
AI Solutions Architect
Solutions Architects bei Telekommunikations- und Großkunden-Beratern liefern strukturierte Risiko-Audits dieser Art als Standard-Produkt. Die Challenge baut die methodische Grundlage.
Dieses Projekt schärft
- risk-categorization
- mitigation-design
- security-reporting
Noch eine Sache