Niedrigressourcen-MT fuer Schweizerdeutsch in einer Bundesverwaltung
Übersicht
Worum es bei diesem Projekt geht.
Du erhaeltst rund 12 000 parallele Saetze (Schweizerdeutsch → Standarddeutsch) plus rund 100 000 einsprachige Saetze in Schweizerdeutsch. Implementiere Backtranslation: trainiere ein Standarddeutsch-zu-Schweizerdeutsch-Modell, generiere synthetische Schweizerdeutsch-Standarddeutsch-Paare, kombiniere mit den Original-Paaren. Trainiere das finale Modell und evaluiere mit BLEU + manueller Bewertung. Liefere Pipeline, Vergleich (nur Original / Original + Backtranslation), und 3-seitiges Memo zur Eignung als interne Hilfe.
Das Briefing
Was Du tust und was Du zeigst.
Baue eine Schweizerdeutsch-zu-Standarddeutsch-MT, die Backtranslation als Daten-Augmentation messbar nutzt.
Earning criteria — what you'll demonstrate
- Backtranslation als Standard-Technik fuer niedrigressourcen-MT anwenden
- Den Trade-off zwischen Datenmenge und Daten-Rauschen in synthetischen Paaren verstehen
- Eine MT-Loesung fuer eine regulierte Umgebung (DSGVO) entwickeln
- MT-Qualitaet ehrlich als 'interne Hilfe' statt als 'Uebersetzung' framen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP Engineer
Backtranslation fuer niedrigressourcen-MT ist eine Kerntechnik, die NLP-Engineers in der EU-Sprachenlandschaft taeglich anwenden.
Dieses Projekt schärft
- neural-machine-translation
- data-augmentation
- low-resource-mt
ML Researcher
Daten-Augmentation methodisch sauber zu pruefen und manuelle Bewertung gegen BLEU zu stellen ist klassische MT-Forschung.
Dieses Projekt schärft
- data-augmentation
- model-evaluation
- low-resource-mt
AI Solutions Architect
Eine MT-Loesung fuer eine regulierte Verwaltungsumgebung zu konzipieren ist klassische Architektur-Arbeit in oeffentlichen Auftraggebern.
Dieses Projekt schärft
- transformers
- neural-machine-translation
- pytorch
Noch eine Sache