Übersicht
Worum es bei diesem Projekt geht.
Du erhaeltst die Text- und Bildsammlung sowie 100 Beispiel-Anfragen mit manuell gepflegten Soll-Antworten. Implementiere: (1) Text-Embeddings mit mehrsprachigem Modell, (2) Bild-Embeddings mit CLIP, (3) gemeinsamer Vektor-Index, (4) cross-modal Retrieval, (5) LLM-Generation, die sowohl Text-Snippets als auch eingebundene Bilder zitiert. Bewerte: Cross-Modal-Recall, Answer Quality (Mensch-Rubrik auf 40 Stichproben), Antwortzeit. Achte auf saisonale + zeitliche Filter (Oeffnungszeiten).
Das Briefing
Was Du tust und was Du zeigst.
Baue ein Multi-Modal-RAG, das Text und Bilder kombiniert und Gaestefragen mit zeitlicher Kontextierung beantwortet.
Earning criteria — what you'll demonstrate
- Multi-Modal-Retrieval mit CLIP-aehnlichen Embeddings entwerfen
- Metadaten-basierte Filterung (Zeit, Geo, Kategorie) als Pflicht-Schicht im Retrieval einbauen
- RAG-Generation mit gemischten Quellen (Text + Bild) zitieren
- Tourismus-spezifische Eval-Faelle ehrlich abdecken
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenAI Engineer
Multimodale RAG-Systeme zu liefern ist eines der schnellst-wachsenden AI-Engineer-Felder 2024-25 — von Tourismus ueber Retail bis Industrie.
Dieses Projekt schärft
- multimodal-rag
- cross-modal-retrieval
- rag-evaluation
NLP Engineer
Cross-Modal-Embeddings mit CLIP-aehnlichen Modellen einzusetzen ist eine Bruecke zwischen klassischer NLP und Computer Vision, die NLP Engineers zunehmend brauchen.
Dieses Projekt schärft
- clip-embeddings
- vector-search
- metadata-filtering
Applied AI Scientist
Multimodale RAG-Pipelines empirisch zu validieren und Limitationen ehrlich zu beschreiben ist Kerngebiet von Applied AI Scientists in Consumer-AI-Teams.
Dieses Projekt schärft
- multimodal-rag
- rag-evaluation
- cross-modal-retrieval
Noch eine Sache