Workshop on Archiving in Digital Cartography and Geoinformation, Berlin 4-5 Dezember

Preserving and Enabling Permanent Access to Cartographic Cultural Heritage



Der unter der Schirmherrschaft von Codata-Germany und der DGfk stehende Workshop, gehörte zu den ersten internationalen Tagungen die das Thema der Archivierung von Geodaten in den Fokus stellten. Entsprechend gespannt war ich auf die Beiträge, denn gemäss meinen Recherchen kann man die Projekte und Institutionen die in diesem Bereich ernsthaft aktiv sind an einer Hand abzählen. Dieser Eindruck bestärkte sich.

Nach meiner Präsentation "OAIS forcartographers" folgte ein Vortrag der zur Neo-Cartography, welcher eigentlich als idealer Übergang von der alten analogen Kartenwelt zur neuen Geodatenwelt hätte dienen können. Leider bezogen sich im Anschluss doch einige Referenten immer wieder auf die alte analoge Kartenwelt, rsp. zu deren Digitalisierung und Speicherung. Zur Digitalisierung ist im vergangen Jahr viel gesagt und geschrieben worden, so dass diese Vorträge hier konsequent ausgeklammert werden. Auch die beiden Damen des National Archives (UK), welche durchaus von ihren Erfahrung im Bereich GIS-Archivierung hätten berichten können, liessen sich stattdessen über die europäische INSPIRE-Richtlinie aus, welche der Geodatenarchivierung zu wenig Rechnung trage.

Archivierung von Forschungsdaten

Ein sehr interessanter Beitrag aus der Praxis lieferte der Zürcher Geograf Stephan Imfeld, welcher von den Erfahrung im Umgang mit Geodaten aus dem Schweizer Nationalpark berichtete. Als knallharter Pragmatiker, listete er mögliche Gefahrenquellen für Datenverlust auf. Neben einigen Hardware-bedingten Fehlern, sei eine Gefahrenquelle immer wieder der Mensch der häufig aus Unkenntnis Daten löscht oder sich auch zu wenig Zeit nimmt um die Daten exakt zu beschreiben um so für die Nachwelt brauchbar zu hinterlassen. Im Forschungsalltag bleibe für eine korrekte Ablage schlicht einfach keine Zeit. Noch zu stark sei der Gedanke verbreitet, die Forschung Ende mit der Publikation. Noch schlimmer sei, wenn das Wissen über die Daten verloren gehe, darum riet er "keepit online", der ständige Zugang und Gebrauch von Geodaten sei die beste Erhaltungsstrategie.

Breite Front unter Einbezug aller Beteiligten

Ebenfalls sehr passend war der Vortrag zum North Carolina Geospatial Data Archiving Project, eins der 8 Digital Preservation-Projekte (NDIIPP) der Library of Congress. Ziele des Projektes befanden sich im organisatorischen Bereich, indem verschiedene Personen und Instiutionen einbezogen wurden um überhaupt ein Bewusstsein zur Erhaltung zu bilden. In der Praxis seien die verschiedenen Zeitständen immer mit den neuen Daten überschrieben worden. Wichtig war es deshalb nicht Preservation nicht nur als nachfolgende Arbeit neben dem operationellem Geschäft zu verkaufen, sondern als wertseigernde Veredlung aktueller Geodatenproduktion.

Archivierung von relationalen Datenbanken

Am zweiten Tag stellte KrystinaOhnesorge vom Schweizerischen Bundearchiv, die vom BAR entwickelte Lösung SIARD zur Archivierung von relationalen Datenbanken vor. Da Geodaten insbesondere Vektordaten zurzeit in relationalen Geodatenbanken vorliegen, stiess dieser Ansatz auf besonderes Interesse. Inwieweit sich dieser Ansatz tatsächlich auf Geodaten anwenden lässt, soll am Anfang des nun anlaufenden Projektes "Archivierung von Geodaten"  von Swisstopo und dem Bundesarchiv geklärt werden. SIARD dessen Spezifikation erst seit Oktober dieses Jahres online ist, übersetzt Daten und Struktur aus verscheidenen Datenbanksystemen (Oracle, MySQL) in das "neutrale" Datenbankformat SIARD, woraus es dann später wieder in eine aktuelle Anwendung exportiert werden kann.

Geodatenbezug für Laien und Experten

Helen Jenny vom Institut für Kartografie der ETH erläuterte wie ein Zugriff auf Geodaten an einer Hochschule für Laien und auch Experten aussehen könnte. Die ETH hat eine Campuslizenz für die jeweils neusten Geobasisdaten von Swisstopo. Diese werden in kleinen Segmenten geliefert und wurden bis vor kurzem von der ETH als Files in einer rudimentären Ordnerstruktur auf einem Fileserver angeboten, was insbesondere für Laien immer wieder für Verwirrungen sorgte. Das Institut entwickelte im Rahmen eines E-Learning Projektes einen webbasierten Zugang, mit verschiedenen Auswahl- und Bestellmöglichkeiten. Nach Ablauf des Projektes wurde auch die ETH-Bibliothek angefragt, ob sie die Plattform weiterführen rsp. unterhalten könnte. Ein möglicher Kandidat für Weiterführung und Unterhaltung des Projekts war die ETH Kartensammlung. Bisher verbleibt die Plattform aber beim Institut.

Strategien der deutschen Staatsarchive

Abgerundet wurde die Tagung durch die Präsentation über die Strategien der deutschen Staatsarchive von Peter Sander aus dem Hessischen Staatsarchiv. Er präsentierte Ansätze die zurzeit in deutschen Staatsarchiven angewendet werden und nannte zu jeder Strategie die Vor- und Nachteile, wobei keine vorbehaltlos überzeugen konnte. Bei den meisten Ansätzen, war eine Archivierung mit der Reduktion von Information (von dynamisch zu statisch) verbunden. Als zudem die in der Archivwelt seit jeher angewandte Praxis der Kassationsrate von ca. 95 % angetönt wurde, kam wie zu erwarten Protest aus dem Publikum und es wurde die Frage aufgeworfen ob die Selektion der Archivare überhaupt den Bedürfnissen der zukünftigen Nutzer entsprechen kann. Insbesondere wenn durch den Export in ein statisches Format (z.B. PDF) die "Intelligenz" von Geodaten und Fachanwendungen verloren geht.

Exkurs: Archive im digitalen Zeitalter

Die Distanz zwischen der Geobranche und der Archivwelt wurde offensichtlich, so dass einige Vertreter aus der Archivwelt ihr Tun mit dem Verweis auf eine lange Tradition zu rechtfertigen versuchten. Ohne Zweifel haben Archive ein grossesKnow-How was das Bewerten und Verzeichnen von Unterlagen betrifft und dieses Know-How ist weiterhin auch im digitalen Bereich gefragt. Doch müssen hinsichtlich neuer Möglichkeiten von digitalen Daten auch die bisherigen Methoden der Archivwelt kritisch hinterfragt werden. 



Sollen beispielsweise immer noch 95 % aller Daten gelöscht werden, wenn der Speicherplatz im Textbereich eine komplette Speicherung zulässt (für Geodaten gilt dies selbstverständlich noch nicht). Können traditionelle Archive, welche sich gemäss Auftrag auf das Abbilden von Verwaltungstätigkeit beschränken, tatsächlich noch ein glaubwürdiges Bild an zukünftige Generationen überliefern. Viele für die Gesellschaft relevante Informationen befindet sich bereits ausserhalb des Wirkungskreises traditioneller Archive (z.B. Websites, Facebook, Youtube, Google Earth, Wikipedia etc.) und erlangen immer stärkere Bedeutung. Ein Archiv mag solche Entwicklungen zwar kurzfristig ignorieren und sich am engen politischen Auftrag festklammern. Doch dem fortdauernden Wandel von Erwartung der Nutzerschaft kann sich ein Archiv nicht entziehen und muss langfristig sogar seine Existenz legitimieren. Bibliotheken sind bereits heute mit der wachsenden "Google-Mentalität" konfrontiert: Ein Stichwort soll unmittelbar zur relevanten Information führen. Ähnliche Forderungen für schnellen und permanenten Zugriff auf Daten von heute und gestern werden auch auf Archive zukommen rsp. sind schon da und können kaum rückgängig gemacht werden. Verweise auf die Komplexität und spezielle Situation von (Datenschutz, Sperrfristen, Kontextwahrung etc.) werden von der Nutzerschaft nur bedingt als Begründung akzeptiert, wenn ein Archiv keine befriedigende Lösungen zur digitalen Archivierung bieten kann. Dabei ist die Situation paradox: Archive sind per definitionem konservativ, d.h. sie erhalten jene Daten, welche für den ursprünglichen Zweck nicht mehr gebraucht werden. In der digitalen Welt müssen Archive jedoch sehr innovativ sein und proaktiv handeln. Zur optimalen Erfüllung des konservativen Auftrags, müssten sie sogar noch innovativer als die treibende IT Branche sein und die bei der Archivierung entstehenden Probleme bereits vor der Entstehung zu lösen (z.B. bei der Formatentwicklung direkt mitzuwirken). 

Inzwischen haben zwar viele Archive erkannt, dass man nicht mehr warten kann bis die Akten rsp. Daten mehr oder minder zufällig abgeliefert werden, sondern man proaktiv auf die Datenproduzenten zugehen muss um eine geordnete Archivierung zu erreichen. Zudem wurde mit dem Projekt Planets bereits einige sehr interessante und anwendbare Tools geschaffen. Dennoch ist die Kompetenz der Archive im Bereich der digitalen Archivierung noch kaum wahrnehmbar (höchstens ein Interesse). 

Wer soll Geodaten archivieren?

Zweifel inwiefern die Lösung zur Geodatenarchivierung von der Archivseite her kommen kann, war auch an der Tagung spürbar. Wer aber sonst hat die Kompetenz? Wenige Male wurden auch die Bibliotheken ins Rennen gebracht, insbesonders bei Geodaten aus der Forschung. Bibliotheken gelten als starke und verlässliche Partner bei der Archivierung von (analogen) Publikationen, bei digitalen Primärdaten scheiden sie jedoch wegen fehlender Infrastruktur und Know-How jedoch schnell als potentieller Partner aus. Wollen Bibliotheken im Bereich der Geodatenarchivierung (rsp. genrell bei der Primärdatenarchivierung) mitmischen, muss zuerst ein grosser Vertrauensbeweis für die technische Kompetenz erbracht werden.

Fazit

Die Tagung hat sich gelohnt. Ich fand ich meine These bestätigt, dass die Geodatenarchivierung tatsächlich noch nicht gelöst ist. Zudem war es sehr spannend nun die Leute kennen zu lernen, über deren Projekte ich bereits vieles gelesen habe. Bereichernd waren auch die Gespräche zwischendurch.
Sehr informativ waren die Gespräche mit Frau Ohnesorge vom Bundesarchiv. Es war es gut mal Informationen aus erster Hand zum Langzeitarchivierungsprojekt ARELDA zu hören, auf dessen Abschlussbericht man gespannt sein darf.
Mein Eindruck bestärkte sich, dass gerade für die Langzeitarchivierung verschiedenste Institutionen zusammenrücken sollten. Frau Ohnesorge betonte zwar vehement, dass Archive einen anderen Auftrag und somit auch einen mit Bibliotheken unvereinbaren Ansatz zur Langzeitarchivierung verfolgen. Doch schon die Zusammensetzung des Planets-Consortium zeigt, dass gemeinsame Interessen vorhanden sind und auch gemeinsame Lösungen gefunden werden müssen.

Link Archiving 2008: http://www.codata-germany.org/Archiving_2008/

30.Dez.2008, Christian Gutknecht, Hauptbibliothek Universität Zürich