Prompt-Injection-Verteidigung fuer Kunden-Chatbot einer Versicherung
Übersicht
Worum es bei diesem Projekt geht.
Du erstellst einen Red-Team-Katalog mit 60 Angriffen ueber 5 Klassen: Direct Injection ('Ignoriere oben...'), Indirect Injection (verseuchte Wissensdokumente), Jailbreak via Rollenspiel, Data Exfiltration (Bitte um System-Prompt-Wiederholung), Encoding-Attacks (Base64, Sprachwechsel). Implementiere drei Verteidigungen und teste die Erfolgsrate jedes Angriffs unter jeder Verteidigung. Liefere: (1) Angriffskatalog als JSON, (2) Implementierung der Verteidigungen, (3) Heatmap Angriff x Verteidigung mit Erfolgsraten, (4) Empfehlung mit Restrisiko-Beurteilung. Halte dich an verantwortliche Offenlegung: keine zero-day-Veroeffentlichung neuer Jailbreaks.
Das Briefing
Was Du tust und was Du zeigst.
Baue einen Red-Team-Katalog und evaluierte Verteidigungsstrategie fuer einen Versicherungs-Chatbot, der gegen die wichtigsten Prompt-Injection-Klassen geschuetzt ist.
Earning criteria — what you'll demonstrate
- Prompt-Injection-Angriffsklassen systematisch katalogisieren
- System-Prompt-Haertung, Klassifikator-Filter und Output-Validierung als Verteidigungsschichten kombinieren
- Sicherheits-Trade-offs (False Positives vs. False Negatives) quantitativ darstellen
- Restrisiken fuer Compliance-Stakeholder verantwortbar formulieren
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenAI Safety Researcher
Red-Teaming gegen einen produktnahen Chatbot mit dokumentierten Verteidigungen ist das Standardprojekt eines AI Safety Researchers in Compliance-getriebenen Branchen wie Versicherung und Finance.
Dieses Projekt schärft
- prompt-injection-defense
- red-teaming
- ai-safety
Prompt Engineer
System-Prompt-Haertung und mehrschichtige Verteidigung sind tagliche Aufgaben fuer Prompt Engineers an oeffentlich exponierten LLM-Produkten.
Dieses Projekt schärft
- system-prompt-design
- prompt-injection-defense
- evaluation-design
AI Engineer
Schichten aus Klassifikator-Filter, Hardened Prompt und Output-Validator zu bauen und reproduzierbar zu evaluieren ist Kernarbeit fuer AI Engineers in produktiven LLM-Systemen.
Dieses Projekt schärft
- python
- system-prompt-design
- evaluation-design
Noch eine Sache