Erfassung und Erschließung von Internetinhalten

Aus der Zuständigkeit bzw. dem Sammlungsprofil der archivierenden Stelle ergibt sich, welche Webpräsenzen zu erfassen sind. Es wird sich dabei in der Regel um Inhalte handeln, die originär im Auftrag der relevanten Personen und Institutionen selbst erstellt wurden.

Fallweise können auch Inhalte von Bedeutung sein, die von Dritten über diese Gruppen ins Netz gestellt wurden. Zunehmend wird neben der Homepage auch die Präsenz in sozialen Netzwerken gepflegt. Ob deren Inhalte relevant sind, muss nach Sichtung der Seiteninhalte vom Archiv/Archivar entschieden werden. Nicht selten werden auf den Plattformen der Sozialen Netzwerke die Grenzen privater und öffentlicher Selbstdarstellung vermischt. In jedem Fall sollte beim Seiteninhaber, der in vielen Fällen auch der Rechteinhaber ist, um Genehmigung zur Durchführung der Archivierung angefragt werden.

Die Analyse der technischen Darbietungsform der Inhalte bietet die Möglichkeit, schon vorab verschiedene Daten von und über die Seite zu erfassen. Wie viele Ebenen enthält die Seite, sind Bilder- oder Videogalerien vorhanden, werden Dokumente etc. zum Download angeboten? An diesem Punkt können bereits Angaben für die weitere Erschließung der Seite, zum Beispiel für eine Schlagwortvergabe gewonnen werden. Wie tief diese Analyse vorgenommen werden kann, wird von der Bedeutung der Provenienz für das eigene Archiv, von der Zahl der insgesamt zu archivierenden Seiten und nicht zuletzt auch von den personellen und technischen Ressourcen abhängen.

Die Feststellung der URL als Startpunkt für den Spiegelungsprozess, auf der Seite enthaltene Dateitypen und Dateigrößen, Aktualisierungsintervalle etc. ermöglichen eine auf die jeweilige Seite zugeschnittene Einstellung der Erfassungssoftware. Einige dieser Metadaten werden bei einer möglichen Konvertierung oder Migration für die Langzeitarchivierung relevant: Welche Browserversion wurde eingesetzt, welche Version der Archivierungssoftware? Die aus der inhaltlichen und technisch-strukturellen Erfassung gewonnenen Daten können und sollten auch den Nutzern zur Verfügung gestellt und bei Bedarf erläutert werden.

Eine spezielle Seite zur Erschließung beschäftigt sich mit dieser Problematik

Weitere spezielle Problematiken finden sich bei:

der Erfassung von sozialen Netzwerken

der Webarchivierung bei der Nutzung von "Apps"

(Textbeitrag: Katharina Köhn, Fabian Theurer)