KI & Daten
Generative KI & LLMs Challenges
Generative KI & LLMs-Challenges versetzen dich mitten in die Arbeit, mit Large Language Models zu bauen. Du entwickelst Fähigkeiten in Prompt-Mustern, Few-Shot-Prompting, Chain-of-Thought und LLM-API-Integration und lernst, wie sich diese Modelle verhalten, bevor du sie skalierst.
Von dort meisterst du die kniffligeren Themen — RAG-Architekturen, Vektor-Datenbank-Grundlagen, Fine-Tuning und Prompt-Versionierung — und legst LLM-Guardrails sowie LLM-Evaluation um jedes Deployment so, wie es KI-Teams wirklich tun. Jede gelöste Challenge bringt dir einen verifizierten Nachweis für Recruiter.
- CodeMittelstufeNeu
LoRA-Fine-Tuning eines Mistral-Modells für Versicherungs-E-Mails
Du bekommst 25.000 anonymisierte E-Mails mit Kategorie-Labels und 5.000 Holdout-Mails. Fine-tune Mistral-7B mit LoRA-Adaptern (Rank 16, alpha 32) auf einer A100-GPU. Trainiere d…
- Fine Tuning
- Fine Tuning
- LLM Evaluation
Fine-Tuning Large Language Models - ResearchMittelstufeNeu
Capability- und Safety-Evaluation für ein Open-Source-LLM
Du erhältst Zugang zum Modell und zu einer Liste etablierter Benchmark-Suites (z. B. MMLU für allgemeines Wissen — Massive Multitask Language Understanding — mit deutschsprachig…
- Capability Evaluation
- Safety Evaluation
- Benchmark Design
AI Measurement and Evaluation - CodeMittelstufeNeu
Knowledge-Graph-RAG für ein Schwäbisches Maschinenbau-Wissensportal
Du erhältst 5.000 technische Dokumente (anonymisiert), einen vorbereiteten Wissensgraph mit Maschinentyp, Baureihe, Baugruppe, Ersatzteil und 100 typische Servicetechniker:innen…
- Knowledge Graph RAG
- RAG Architekturen
- Graph Queries
Knowledge Graphs and Semantic Web - ResearchSeniorNeu
Instruction-Tuning und DPO für einen Customer-Support-Bot
Du bekommst 5.000 idealtypische Instruction-Antwort-Beispiele (kuratiert vom Service-Team) und 600 Präferenz-Paare (gleicher Prompt, zwei Antworten, präferierte Antwort markiert…
- Instruction Tuning
- Dpo
- Preference Optimization
Fine-Tuning Large Language Models Practice your coursework on real scenarios.
Every challenge is shaped from real-world context — not generic exercises. The work mirrors what your degree prepares you for.
Why Ewance
- AnalysisEinsteigerNeu
Automatisierte Aufsatz-Bewertung für ein Sprachlern-Startup
Du erhältst 600 anonymisierte Lernertexte (300 auf B1, 300 auf B2) mit jeweils zwei unabhängigen menschlichen Bewertungen nach einer Vier-Achsen-Rubrik (Inhalt, Aufbau, Wortscha…
- Automated Assessment
- Prompt Muster
- LLM Evaluation
AI in Education and Learning Analytics - CodeMittelstufeNeu
QLoRA auf Consumer-Hardware für ein juristisches Modell
Du bekommst 3.500 anonymisierte Schriftsätze (rund 20 MB Text), die Kanzlei-Style-Guide und Zugriff auf eine RTX-4090. Setze QLoRA mit bitsandbytes auf, trainiere zwei Varianten…
- Qlora
- Fine Tuning
- Fine Tuning
Fine-Tuning Large Language Models - CodeSeniorNeu
DPO-Finetuning fuer Tonalitaets-Anpassung eines mehrsprachigen Modells
Du erhaeltst ein Open-Source-Basismodell (rund 8B Parameter), 4.000 Praeferenzpaare und 200 Holdout-Prompts. Implementiere: (1) SFT-Baseline auf den 'chosen'-Antworten, (2) DPO-…
- Direct Preference Optimization
- Supervised Finetuning
- Fine Tuning
Machine Learning from Human Preferences (RLHF and Alignment) - CodeEinsteigerNeu
Evaluations-Framework für ein RAG-System eines E-Commerce-Suchstartups
Du erhältst die bestehende RAG-Pipeline (LangChain + OpenAI), 250 kuratierte Testanfragen mit Goldstandard-Antworten und ein vom Team gewünschtes Mindestmaß an Faithfulness. Bau…
- LLM Evaluation
- RAG Architekturen
- Ci Cd
Information Retrieval and Search - Browse challenges
Explore role
Product Manager
Ship product that solves real user problems. Combine user research, prototyping, and stakeholder alignment to turn ambiguous briefs into measurable wins — the role at the centre of modern software teams.
- AnalysisMittelstufeNeu
Bias- und Fairness-Audit eines deutschen Konzern-LLMs
Du erhältst die System-Prompt-Konfiguration des Assistenten, einen Trace von 500 anonymisierten Beispiel-Interaktionen und ein vom Betriebsrat freigegebenes Testdesign. Implemen…
- Bias Evaluation
- Fairness Auditing
- Counterfactual Testing
Large Language Models - CodeMittelstufeNeu
Skalierbare Aufsicht für eine Code-Generierungs-Pipeline
Du erhältst 500 historische Pull-Request-Vorschläge mit menschlichen Sicherheits-Bewertungen ('sicher', 'grenzwertig', 'kritisch'). Entwirf eine Pipeline mit drei Stufen: 1) Vor…
- Scalable Oversight
- Debate Methods
- Iterated Distillation
AI Safety and Alignment - CodeEinsteigerNeu
Latenz- und Kosten-Optimierung für ein Hamburger E-Commerce-Chat
Du erhältst Zugriff auf 50.000 anonymisierte Chat-Sessions plus Kosten- und Latenz-Logs. Baue (1) einen Klassifikator (klein, ggf. Distil-Modell oder Few-Shot mit GPT-4o-mini), …
- Finops & Kostenoptimierung
- Model Routing
- Streaming
LLM Application Development - CodeEinsteigerNeu
RAG-Prototyp für IT-Helpdesk eines OWL-Mittelständlers
Sie erhalten einen anonymisierten Korpus von rund 1.200 internen Wiki-Artikeln + 300 historischen Ticket-Antworten. Bauen Sie eine RAG-Pipeline: Embedding eines Open-Source-Mode…
- RAG Architekturen
- Word Embeddings
- Vector Databases
AI/ML Practicum and Hands-on Lab Build a verifiable portfolio.
Submissions become evidence. Reviewers with shipping experience score against a rubric; the result becomes a credential anyone can verify.
Why Ewance
- CodeMittelstufeNeu
Enterprise-RAG-Pipeline für eine Unternehmensberatung
Du erhältst 12.000 vorbereitete Berichts-Chunks (anonymisierte Kund:innen) mit Metadaten (Branche, Jahr, Region) sowie 80 typische Berater:innen-Anfragen mit Goldstandard-Antwor…
- RAG Architekturen
- Hybrid Search
- Re Ranking
Information Retrieval and Search - CodeEinsteigerNeu
NLP-gestützter Kunden-Service-Autoresponder für ein Berliner Fintech
Du erhältst 25.000 anonymisierte Support-Tickets mit 12 Kategorien plus eine Domänen-FAQ-Liste mit 200 Einträgen. Baue eine Pipeline mit (1) feinjustiertem Klassifikator (gbert …
- Text Classification
- RAG Architekturen
- Fine Tuning
Linguistic Engineering and Language Technologies - CodeMittelstufeNeu
Dataset-Kuratierung und Eval-Harness für ein medizinisches Fachmodell
Du bekommst 12.000 anonymisierte Radiologie-Berichte (rohe Exports), Klinik-Style-Guide und eine Liste typischer Failure-Modes (Halluzinationen, falsche Befund-Vereinfachungen).…
- Dataset Curation
- Data Pipelines
- LLM Evaluation
Fine-Tuning Large Language Models - CodeMittelstufeNeu
Multimodale Produkt-Beschreibungs-Pipeline für einen Marktplatz
Du bekommst 5.000 Beispiel-Produkte mit Bild, strukturierten Attributen (Material, Maße, Farben) und vom Redaktions-Team verfassten Referenz-Beschreibungen. Setze eine Pipeline …
- Multimodal Generation
- Vision Language Models
- LLM Evaluation
Generative AI - CodeEinsteigerNeu
Prompt-Versionierung und Regressionstests für ein Wiener KI-Produkt
Du baust ein System mit (1) Prompt-Speicher als versionierten Markdown-/YAML-Dateien im Git-Repo; (2) Test-Set von 200 Beispielen mit Goldstandard-Antworten; (3) GitHub-Actions-…
- Prompt Versionierung
- Ci Cd
- LLM Evaluation
LLM Application Development - ResearchMittelstufeNeu
Red-Teaming einer Behörden-Chatbot-Anwendung in Wien
Du erhältst Zugang zur API-Version des Chatbots, einen 200-Anfragen-Test-Korpus aus echten Verwaltungs-Themen und eine interne Guideline der Stadtverwaltung. Entwerfe und führe …
- Red Team Operations
- LLM Evaluation
- Prompt Injection
Trustworthy AI, Robustness, and Safety - ResearchSeniorNeu
Catastrophic-Forgetting-Studie nach Domain-Fine-Tuning
Du bekommst Zugriff auf das fine-getunte Modell und das Basismodell, eine Auswahl Standard-Benchmarks (MMLU-Subset, HumanEval-Lite, GSM8K-Stichprobe) und 8.000 generische Traini…
- Catastrophic Forgetting
- Continual Learning
- LLM Evaluation
Fine-Tuning Large Language Models - CodeMittelstufeNeu
Evaluations-Pipeline für ein LLM-Kundenservice-Assistenz-Produkt
Du erhältst 200 historische Kundenanfragen plus die Antworten des Beta-Assistenten. Definiere ein Test-Set von 100 Anfragen mit menschlichen Referenz-Antworten. Implementiere dr…
- LLM Evaluation
- Automated Metrics
- LLM As Judge
AI Measurement and Evaluation - CodeEinsteigerNeu
LLM-Evaluations-Suite für ein Wiener KI-Beratungshaus
Du baust eine Python-Suite mit (1) Aufgaben-Definitionen je Klasse; (2) Standard-Datensätzen (MMLU für Wissen, GSM8K für Mathe, deutsche Aufgaben aus z. B. dem GermanBenchmark);…
- LLM Evaluation
- Benchmarking
- Multilingual Evaluation
Large Language Models - CodeEinsteigerNeu
Evaluations-Framework für ein KI-Suchassistenten-Produkt aufbauen
Du arbeitest mit dem Engineering-Team an einem Eval-Framework auf Basis von OpenAI Evals oder Promptfoo (open-source-Werkzeuge zur strukturierten Bewertung von Sprachmodell-Antw…
- LLM Evaluation
- Prompt Muster
- Metric Design
AI for Business and AI Product Management
So funktioniert's
Vom Briefing zum Zertifikat – in sechs Schritten.
Schritt 01
Durchsuche Challenges passend zu Deinem Studium.
Schritt 02
Wähle das Projekt, das zu Deinen Zielen passt.
Schritt 03
Arbeite es mit Hilfe des AI Copiloten durch.
Schritt 04
Reiche es zur strukturierten Bewertung ein.
Schritt 05
Erhalte ein verifiziertes Zertifikat.
Schritt 06
Füge es Deinem LinkedIn-Profil mit einem Klick hinzu.
Verwandte Kompetenzfelder
Alle Kompetenzen durchsuchenBranchenteams hinter einem Jahrzehnt praxisorientierter Briefings
Aus diesem Pool einstellen?
Sponsere eine Challenge und lerne Kandidaten durch ihre tatsächliche Arbeit kennen.
Industrieteams können Briefings rund um die Fähigkeiten gestalten, die sie suchen, und Studierende anhand von bewertungsmatrix-gestützten Ergebnissen beurteilen – nicht anhand von Lebensläufen.



















































































