Bereitstellung

Die Nutzung von archivierten Webseiten hängt von den rechtlichen Rahmenbedingungen und dem Sammlungsfokus des Webarchivs ab. Eine Bereitstellung kann über das Internet erfolgen oder nur an lokalen Arbeitsplätzen der archivierenden Institution, was abhängig von den Rechteinhabern der Seiteninhalte ist. Im Fall der Deutschen Nationalbibliothek, die den gesetzlichen Auftrag hat, alle in Deutschland veröffentlichten Medienwerke auf Dauer zu sichern und für die Allgemeinheit nutzbar zu machen, ist die Bereitstellung in deren Lesesälen ohne ausdrückliche Zustimmung des Rechteinhabers möglich.

Der Zugriff auf die archivierten Webseiten kann entweder in einer speziell dafür vorgesehenen Software oder in einem gängigen Webbrowser erfolgen. Grundsätzlich sind dabei vier mögliche Zugangsvarianten in Webarchiven zu finden:

1.    Hierarchische Auflistung

Alle archivierten Webseiten werden in einer Hierarchie für den Nutzer aufgelistet, z. B. in einer aufklappbaren Baumstruktur. Diese kann auf Einordnungen in Sammlungskategorien, Projekten oder Ereignissen basieren. Auf unterster Ebene der Hierarchie befinden sich Links zu den einzelnen Spiegelungen.

2.    Katalogisierung

Für jede Webseite bzw. Spiegelung werden Metadatensätze in einem Nachweissystem erstellt. In dem Datensatz findet sich ein Link für den Zugriff zur Spiegelung. Zur Nutzung stehen die Suchmöglichkeiten des Nachweissystems zur Verfügung. Bei Bibliotheken kann dies eine Integration des Webarchivs in das Katalogsystem sein.

3.    URL-Suche

Webseiten werden im Internet durch ihre jeweilige Adresse (URL) identifiziert. Bei der URL-Suche in einem Webarchiv muss diese bekannt sein. Als Ergebnis der Suche wird eine Liste aller Spiegelungen für die URL geliefert, von wo aus der Zugriff erfolgen kann. Die URL-Suche ist der Zugriff bei der Software Wayback Machine, die vom größten Webarchiv der Welt, dem Internet Archive, genutzt wird.

4.    Volltextsuche

Über alle archivierten Webseiten wird ein Volltextindex erstellt, die eine Suche über die textuellen Inhalte der Seiten ermöglicht. Als Treffer der Suchanfragen werden die Seiten mit den Spiegelungen aufgelistet, in denen die Suchbegriffe gefunden wurden mit Verlinkung zu den archivierten Spiegelungen.

Diese vier Varianten können in Kombination auftreten. So können die Treffer einer Volltextsuche in einer Hierarchie angeordnet sein oder nach Metadaten gefiltert werden.

(Textbeitrag: Tobias Steinke)