Sicherheits-Sandbox für autonome Web-Agenten in einem Zürcher AI-Startup entwerfen
Übersicht
Worum es bei diesem Projekt geht.
Du entwirfst die Sicherheits-Architektur und implementierst einen Prototypen-Web-Agent mit Browser-Tool (Playwright), Sandbox-Schichten (Tool-Whitelist, Kosten-Cap pro Sitzung, sensible-Aktion-Bestätigungsschritt) und Beobachtungs-Logging. Dann führst du 40 Red-Teaming-Versuche aus 5 Angriffsklassen durch (Prompt-Injection via Webseiten, Versuche, Kosten-Cap zu umgehen, Daten-Exfiltrations-Versuche, Goal-Hijacking, Endless-Loop). Bewerte Sandbox-Effektivität (welche Angriffe wurden blockiert), Fehlalarm-Rate (legitime Aufgaben fälschlich blockiert) und Latenz-Kosten. Liefere ein Sicherheits-Memo mit Beleg-gestützten Empfehlungen für den Beta-Launch.
Das Briefing
Was Du tust und was Du zeigst.
Entwirf und belege eine Sicherheits-Sandbox für autonome Web-Agenten, die typische Angriffsklassen durch Architektur blockiert, ohne legitime Aufgaben spürbar zu behindern.
Earning criteria — what you'll demonstrate
- Sicherheits-Architektur für agentische Systeme entwerfen, die nicht nur auf Prompt-Anweisungen vertraut
- Red-Teaming gegen LLM-Agenten methodisch durchführen
- Angriffsklassen kategorisieren und Mitigations-Strategien zuordnen
- Sicherheits-Erkenntnisse für Produkt- und Compliance-Stakeholder aufbereiten
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenAI Safety Researcher
Architektur-basierte Sicherheits-Entscheidungen für agentische Systeme zu treffen und mit Red-Teaming zu belegen ist das tägliche Brot eines AI Safety Researchers in Consumer-AI.
Dieses Projekt schärft
- ai-safety
- prompt-injection
- red-teaming
AI Engineer
Web-Agenten mit Sandbox-Schichten zu implementieren ist Kerngebiet eines AI Engineers in agent-zentrierten Startups.
Dieses Projekt schärft
- llm-agents
- agent-evaluation
- python
AI Solutions Architect
Sicherheits-Architektur für autonome Systeme zu entwerfen und gegenüber Compliance zu verteidigen ist die Schnittstellen-Arbeit eines AI Solutions Architects.
Dieses Projekt schärft
- ai-safety
- agent-evaluation
- prompt-injection
Noch eine Sache