Wikidata-basiertes Skills-Mapping für eine Hamburger HR-Plattform
Übersicht
Worum es bei diesem Projekt geht.
Du erhältst 8.000 freie Skill-Strings aus der bisherigen Datenbank plus eine kuratierte Liste mit 200 Goldstandard-QIDs. Implementiere eine Pipeline mit (1) Vorverarbeitung (Normalisierung, Sprache erkennen); (2) Wikidata-Suche per SPARQL; (3) Re-Ranking der Kandidaten mit einem mehrsprachigen Embedding-Modell; (4) Schwellwert-basierter Akzeptanz oder Eskalation an einen menschlichen Reviewer. Modelliere die akzeptierten Skills als RDF-Graph mit Vererbung (z. B. Python erbt von Programmiersprache erbt von Software). Liefere Pipeline, Graph, ein Such-Tool und einen 5-seitigen Auswertungsbericht.
Das Briefing
Was Du tust und was Du zeigst.
Wie löst eine Pipeline freie Skill-Eingaben reproduzierbar gegen Wikidata-Konzepte auf, ohne falsche Auflösungen in den Produktiv-Graph zu lassen?
Earning criteria — what you'll demonstrate
- Entity Linking auf Wikidata systematisch durchführen
- Embeddings als Re-Ranking-Schicht im Linking-Prozess einsetzen
- Schwellwert-Logik mit Mensch-in-der-Schleife sauber implementieren
- Wissensgraph-Anreicherung als Daten-Qualitäts-Praxis verankern
Studienpassung
Wo dies in Dein Studium passt.
Schärft dieselben Fähigkeiten, die Dein Studium von Dir erwartet.
Fähigkeiten
Fähigkeiten, die Du unter Beweis stellst.
Jede taucht auf Deinem verifizierten Zertifikat auf.
Karrieren
Berufe, auf die dies Dich vorbereitet.
Echte Berufsbezeichnungen. Echte Skill-Brücken. Wähle die, die Deinem Werdegang am nächsten kommt.
Karrierewege, die das aufbaut
Kanonische RollenData Engineer
Entity Linking gegen Wikidata mit reproduzierbarer Pipeline ist eine direkte Aufgabe für Data Engineers in HR-Tech und vergleichbaren Plattform-Teams.
Dieses Projekt schärft
- entity-linking
- wikidata
- data-quality
NLP-Ingenieur:in
Mehrsprachige Embeddings als Re-Ranking-Schicht plus Schwellwert-Logik sind Standardarbeit von NLP-Ingenieur:innen in Daten-zentrierten Produktteams.
Dieses Projekt schärft
- embeddings
- entity-linking
- sparql
KI-Engineer
Mensch-in-der-Schleife und reproduzierbare Anreicherungs-Pipelines zu verschalten, ist die Tagesarbeit von KI-Engineers in Daten-orientierten Produktteams.
Dieses Projekt schärft
- rdf
- wikidata
- data-quality
Noch eine Sache