Zu Beginn wurde das Thema Austauschprotokolle für Metadaten (nochmals) aufgegriffen. Dies fand ich sinnvoll, da ich bei der letzten Übung mit OAI-PMH nochmals recherchieren musste, was dies genau ist. So wurde auf die drei im Bibliotheks- und Archivbereich am weitesten verbreiteten Übertragungsprotokolle Z39.50, SRU und OAI-PMH genauer eingegangen. Diese unterscheiden sich darin, dass Z39.50 und SRU für den Einzeldatenabgleich oder die Live-Suche genutzt werden während OAI-PMH eher für den Gesamtdatenabzug oder tägliche Aktualisierungen verwendet wird.

In einem nächsten Schritt ging es darum, die erstellten Metadaten aus Archivesspace und Koha über die OAI-PMH Schnittstellen zu «harvesten», also zu sammeln. Hierfür mussten die Endpoints (Adresse unter welcher Schnittstelle verfügbar ist) von Koha und Archivesspace zuerst überprüft und Archivesspace mittels Terminals gestartet werden. Anschliessend installierten wir mittels Kommandos im Terminal ein OAI-Harvester Tool namens VuFindHarvest. Interessant finde ich, dass dieses über kein graphisches Interface verfügt, sondern nur über die Kommandozeile gesteuert werden kann, was gewöhnungsbedürftig ist.

So führten wir im nächsten Step das eigentliche Harvesting durch. Dieses wurde mit folgenden Befehlen ausgeführt, wobei die Parameter url, metadataPrefix und das Zielverzeichnis des zweiten Befehls noch auf unsere Datenquellen hin angepasst werden mussten.

cd ~/vufindharvest-4.1.0

cd (Verzeichnis wechseln)

php bin/harvest_oai.php –url=http://example.com/oai_server –metadataPrefix=oai_dc my_target_dir

php (Wir wollen php Programm aufrufen) - bin (Aufrufen des Programms) - url (Wie ist URL-Schnittstelle erreichbar?) - metadataPrefix (Welches Format soll aus Schnittstelle abgefragt werden?) - Angabe des Zielverzeichnisses

image

Harvesting von Koha im Terminal

Bei der ersten Eingabe erhielt ich eine Fehlermeldung, da ich eventuell einen Tippfehler gemacht hatte. Beim zweiten Versuch hat es allerdings funktioniert und die Datensätze lagen als XML-Datei in den entsprechenden Ordnern.

image

Bsp. geharvestete Dateien von Koha

Nun ging es darum, die Datensätze in ein gemeinsames Format zu bringen. Hierfür verwendeten wir Crosswalks. Dabei sollen Daten aus einem Metadatenstandard, ausgedrückt in einem Metadatenformat, in einen anderen gebracht bzw. konvertiert werden. Im Crosswalk enthalten sind Regeln, wie Elemente und Werte zugeordnet werden sollen. Diese Zuordnung funktioniert in der Regel nicht verlustfrei und so ist es wichtig, dass zuerst ein Vergleich der Formate stattfindet. In diesem Zusammenhang ist auch XSLT zu nennen, eine Programmiersprache zur Transformation von XML-Dokumenten.

In unserem Beispiel haben wir Daten im Standard EAD (Archivesspace) und DC (DSpace), welche nun einheitlich in MARC21XML konvertiert werden sollen. Die Daten von Koha sind bereits im Format MARC21XML.

Für die Konvertierung benutzten wir das Tool MarcEdit7, welches wir zuerst wieder installieren und bestimmte Konfigurationen vornehmen mussten. Anschliessend konnte die Konvertierung stattfinden, in dem die entsprechenden XML-Files von Archivesspace und DSpace ausgewählt und eine Zieldatei definiert wurde. Auch die entsprechende Operation (also von welchem Format in welches Format soll konvertiert werden) musste ausgewählt werden. Wichtig ist, dass dieses Tool keine direkte Transformation von EAD in MARC21XML vornehmen kann, so dass EAD zuerst in MARC (s. Grafik) und von MARC in MARC21XML umgewandelt werden muss.

image

Der anschliessende Vergleich der Ausgangsdatei in EAD zur Zieldatei zeigte nochmals auf, dass die Konvertierung nicht verlustfrei durchgeführt werden kann und so in der Zieldatei viele Elemente fehlen (Bspw. Feld “Mein erstes eigenes Archiv”). Die Konvertierung der DSpace-Datei funktionierte besser (s. Grafiken).

Screenshot from 2021-12-05 10-21-07

Links: Archivesspace-Daten nach EAD in XML _________ Rechts: konvertiert in MARC21XML

Screenshot from 2021-12-05 10-26-54

Links: DSpace-Daten nach DC in XML _______________ Rechts: konvertiert in MARC21XML

Die Themen der Vorlesung waren für mich neu und teilweise sehr «terminallastig». Dennoch konnte ich alle Aufgaben lösen. Abschliessend stellt sich mir die Frage in welchen Anwendungsfällen diese Crosswalks in der Praxis genutzt werden.

Quelle: Unterrichtsskript BAIN HS21 ISc18tzZ Tag 6 (02.12.)