Blogs sind zumeist themenspezifisch. Das technorati.com Blog Directory listet mehr als 1,2 Millionen Blogs in einer Themenhierarchie. Dabei wird die jeweilige Klassifikation vom Blogautoren bei der Anmeldung bei technorati vorgenommen. Könnte man diese Klassifikation automatisieren? In der Arbeit soll die Hypothese untersucht werden, dass die jeweiligen Tags eines Blog eine solche Klassifikation ermöglichen.
Über eine Blog Verzeichnis soll eine hinreichende Menge von Blogs herausgegriffen werden. Für jedes dieser Blog sollen die verwendeten Tags extrahiert und ein Tag-Vektor erzeugt werden. Damit soll nun überprüft werden ob es für eine Kategorie des Blog Verzeichnis einen charakteristischen Vektor gibt. Für eine Untermenge von Kategorien soll überprüft werden ob mit Hilfe dieses Vektors ein zufällig ausgewähltes Blog zutreffend kategorisiert werden kann. Weiterhin ist eine Recherche über eventuell schon vorhandene Arbeiten zu der Thematik zu erstellen (bislang sind nur unbeantwortete Nachfragen bekannt).
Art der Arbeit: Bachelor- oder Studienarbeit
Voraussetzungen: Kenntnisse in Web Technologien, Information Retrieval
Betreuer: Prof. Robert Tolksdorf
Weitere Informationen: Sprechstundentermin bei Prof. Robert Tolksdorf nehmen… [...Weiterlesen/more...]