Über das Seminar

Semantische Technologien eröffnen Web-Anwendungen neue Perspektiven und Möglichkeiten, da sie es ermöglichen, nicht nur Struktur und Format von Dokumenten, sondern auch die Bedeutung ihrer Inhalte in maschinenlesbarer Form zu kodieren. Die Linking Open Data (LOD) Initiative macht semantisch aufbereitete strukturierte Daten öffentlich zugänglich und vernetzt diese untereinander zu einer gigantischen Datenbasis. Dieses Seminar wird die neuen Rechner-Ressourcen des HPI Future SOC Labs nutzen, um im Web verfügbare LOD Ressourcen zu sammeln und einen möglichst vollständigen und aktuellen Testkorpus zu erstellen. Die Verarbeitung der Daten erfolgt auf Highend-Maschinen im Lab (24-48 Kerne, 1-2 TB Hauptspeicher), womit die Erstellung hochparalleler Algorithmen mit geeigneter Datenpartitionierung Teil der Aufgabenstellung ist.


Seminarinhalte
  • Konzeption und Implementierung einer effizienten Web-Crawler Prozesskette zum Crawlen des Semantic Web
  • Effiziente Parallelisierung und Synchronisation einzelner Prozessmodul
  • Effiziente Datenstrukturen zur Repräsentation und Verarbeitung semantischer Daten
  • Effiziente Algorithmen zur parallelen Verarbeitung semantischer Daten

Allgemeine Informationen

Termin: Mi, 15:15 – 16:45, A.2.2
SWS / Belegungspunkte: 4 / 6.0 (benotet)
Website: Large Scale Processing for Semantic Technologies auf der Homepage des HPI



Leistungserfassung
  • Implementierung einer Programmieraufgabenstellung im Team 
  • Seminarausarbeitung
  • Seminarvortrag

Ansprechpartner


Dr. Harald Sack
harald.sack (at) hpi.uni-potsdam.de
(0331) 5509-527               
Raum H-1.39     

Dr. Peter Tröger
peter.troeger (at) hpi.uni-potsdam.de
(0331) 5509-234
Raum C-1.6