Erschließung von Webseiten

Bei der Erschließung von Webseiten stellt sich zunächst die Frage, wie flach bzw. tief eine Webseite erschlossen werden soll. Ist eine Erschließung auf Spiegelungsebene erforderlich oder reicht auch eine Erschließung auf Projektebene aus?

Dies hat Auswirkungen auf die Erschließung auf formaler Ebene und die Metadaten:

  • URL
  • Titel der Webseite
  • Autoren/Körperschaften/Parteien
  • Spiegelungsdatum
  • Schlagwörter
  • Link zum Archiv
  • Zugriffsbeschränkung
  • Bemerkungen

 

Auf intellektueller Ebene

Fehlende Inhalte müssen manuell erschlossen werden.

Nach der Archivierung wird die Spiegelung automatisch volltextindiziert.

Ggf. kann es hilfreich sein, zusätzlich zu den Spiegelungen Screenshots zu archivieren, da Webseiten, je nach Browser, unterschiedlich dargestellt werden können und eine Geoabhängigkeit dessen bestehen kann, was einem Nutzer überhaupt angezeigt wird.

 Mit der Archivsoftware FAUST können die oben aufgeführten Metadaten erfasst und der Link zur gespiegelten Webseite direkt eingebunden werden. So können die Spiegelungen einzeln erfasst und über den Katalog im Lesesaal gesucht und aufgerufen werden. Je nachdem, ob eine inhaltliche Erschließung der Spiegelungen gewünscht ist, können Schlagwörter und Indizes vergeben werden. Auch das Einbinden eines Screenshots zur jeweiligen Spiegelung ist möglich.

Desiderata:

  • Bislang ist nur ein manueller Vergleich unterschiedlicher archivierter Webseiten-Versionen möglich. Hier wäre ein unterstützender automatisierter Prozess wünschenswert.
  • Ein großer Mehrwert wäre eine automatisierte medienspezifische Erschließung von Gesichtern und Stimmen in Form einer integrierten Bild- und Stimmerkennung.

(Textbeitrag: Michael Hansmann)