Normen und Standards sind Voraussetzung für erfolgreiche vernetzte Systeme aller Art. Dies reicht von naheliegenden offenen Systemen wie dem Web bis zu Alltäglichkeiten wie einer europaweit einheitlichen Stromsteckdosenform. Die Standards und Normen selber sind zumeist sehr strukturierte Dokumente, da oft über ihre Form eine Norm oder ein Standard existiert.
Elektronische Dokumentensammlungen wie die W3C Standards, die Standards der ECMA oder die wenigen frei zugänglichen ISO Standards stellen Normen und Standards kostenlos bereit. Interessant ist jeweils die Analyse der Verweisstruktur beispielsweise auf den Ebenen der Referenzierung oder der Erweiterung oder Neuformulierung von Standards und Normen. Die Bachelorarbeit Normennetzwerke: RFCs
an der FU Berlin hat dies exemplarisch für die RFC-Standards gezeigt.
In der ausgeschriebenen Arbeit soll dieser Vorgehensweise verallgemeinert und ein Analysewerkzeug für Normennetzwerke erstellt werden. Algorithmen und Werkzeuge sollen konfigurierbar sein in Bezug auf:
- Startpunkt der Analyse im Web und deren Struktur zum Auffinden einzelner Standards
- Dokumentenstruktur und Extraktionskonfiguration
- Charakteristische Referenzierungsweise anderer Normen
- Charakteristische Markierung von Überarbeitungen
- Ermittlung von Netzwerkmetriken
Art der Arbeit: Diplom- oder Masterarbeit
Voraussetzungen: Kenntnisse in Textextraktion, Crawling, Netzwerkanalyse, Statistik
Betreuer: Prof. Robert Tolksdorf
Weitere Informationen: Sprechstundentermin bei Prof. Robert Tolksdorf nehmen