Sprachsynthese für einen Schweizer Hörbuch-Verlag
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst zwei vortrainierte deutsche TTS-Modelle (z. B. Coqui XTTS und ein VITS-Baseline) und einen Testtext-Korpus (rund 200 Sachbuch-Absätze, je 1-2 Minuten gesprochen). Erzeuge synthetische Audio-Samples in beiden Varianten, führe eine 30-Personen-Hörstudie mit MOS-Bewertung (Mean Opinion Score) durch und vergleiche das Ergebnis mit einer professionellen Sprecher:in-Referenz auf vier Test-Absätzen. Liefere die Pipeline, die Hörstudien-Daten und einen 3-seitigen Bericht mit Investitions-Empfehlung.
Das Briefing
Was Du tust und was Du zeigst.
Baue eine TTS-Baseline für Deutsch in zwei Varianten und liefere eine Investitions-Empfehlung basierend auf einer 30-Personen-Hörstudie.
Earning criteria — what you'll demonstrate
- Vortrainierte TTS-Modelle für Sachtext-Synthese einsetzen
- Eine kleine MOS-Hörstudie methodisch korrekt aufsetzen
- Audio-Qualität gegen eine professionelle Referenz benchmarken
- Eine Investitions-Empfehlung mit Hörstudien-Daten verteidigen
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenNLP-Ingenieur:in
TTS-Modelle für eine konkrete Verlagsanwendung einzusetzen und in einer Hörstudie zu validieren, ist die typische NLP-Arbeit in Audio-Produkten.
Dieses Projekt schärft
- speech-synthesis
- tts
- audio-processing
Angewandte:r KI-Wissenschaftler:in
Eine methodisch saubere Hörstudie in eine Investitions-Empfehlung zu übersetzen, ist die Brückenarbeit, die angewandte KI-Wissenschaftler:innen für Medien-Verlage leisten.
Dieses Projekt schärft
- user-study
- evaluation
- tts
Maschinelles-Lernen-Forscher:in
Vergleich gegen eine menschliche Referenz mit MOS-Standards ist Forschungs-Disziplin, die für jeden ehrlichen Sprach-Modell-Vergleich nötig ist.
Dieses Projekt schärft
- evaluation
- user-study
- audio-processing
Noch eine Sache