Multimodale Produkt-Beschreibungs-Pipeline für einen Marktplatz
Übersicht
Worum es bei diesem Projekt geht.
Du bekommst 5.000 Beispiel-Produkte mit Bild, strukturierten Attributen (Material, Maße, Farben) und vom Redaktions-Team verfassten Referenz-Beschreibungen. Setze eine Pipeline aus einem Vision-Language-Modell (z. B. LLaVA, BLIP-2) für die Bild-Beschreibung und einem LLM für die Marken-Anpassung. Evaluiere mit BLEU, ROUGE und einer Likert-Bewertung von 5 Redakteur:innen. Liefere die Pipeline, einen Eval-Bericht und ein Demo-Dashboard.
Das Briefing
Was Du tust und was Du zeigst.
Liefere eine multimodale Pipeline aus Vision-Language-Modell und LLM, die Produktbeschreibungen für den Möbel-Marktplatz markenkonform automatisiert.
Earning criteria — what you'll demonstrate
- Multimodale Generative-AI-Pipelines konkret aufsetzen
- Vision-Language-Modelle mit LLMs sinnvoll verknüpfen
- Prompt-Engineering für Markenkonformität gezielt einsetzen
- Generative Pipelines fair evaluieren — automatisch und menschlich
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenKI-Ingenieur:in
Multimodale Generative-AI-Pipelines bis zur Redaktions-Demo zu liefern ist exakt die Arbeit von KI-Ingenieurinnen in Marktplatz- und Content-Plattformen.
Dieses Projekt schärft
- multimodal-generation
- vision-language-models
- python
Prompt-Ingenieur:in
Marken-Style-Guides per Prompt-Engineering robust umzusetzen ist die Kerntätigkeit von Prompt-Ingenieurinnen in Content-Plattformen.
Dieses Projekt schärft
- prompt-engineering
- llm-evaluation
- vision-language-models
ML-Ingenieur:in
Eine produktionsreife Eval-Pipeline mit menschlichem und automatischem Maß zu bauen ist genuine Engineering-Aufgabe.
Dieses Projekt schärft
- huggingface
- llm-evaluation
- multimodal-generation
Noch eine Sache