In der heutigen 8. Vorlesung beschäftigten wir uns mit Suchmaschinen und Discoverysystemen. Dies war sozusagen der Höhepunkt des Kurses, da nun all unsere erstellten Daten der verschiedenen Systeme in einer gemeinsamen Suchmaschine zusammengefasst werden sollten.

Für die Vorlesung hatten wir bereits als Hausaufgabe die Software VuFind installiert und, wie in Übung 3 beschrieben, bestimmte Konfigurationen vorgenommen. VuFind ist die führende Open-Source Software für Discovery-Systeme und wird von einer Vielzahl von Kultur- und Bildungsinstitutionen, wie zum Beispiel Bibliotheken, im deutsch- und englischsprachigen Raum genutzt.

Aber was ist ein Discovery-System überhaupt? Discovery-Systeme sind Suchsysteme im Bibliothekskontext, die auf Suchmaschinentechnologien basieren und dementsprechend auch Funktionen wie Trefferranking oder Autovervollständigung anbieten (Quelle: Wikipedia).

Im Übrigen haben wir uns die Suchmaschine Solr angeschaut, welche für viele Internetseiten genutzt wird und die Grundlage für VuFind bildet. Umso erstaunlicher, dass ich bis anhin noch nie etwas davon gehört hatte. Solr ist ebenfalls eine Open-Source-Software. Sie funktioniert so, dass ein Suchindex aufgebaut wird und dieser über eine Webschnittstelle abgefragt werden kann. Wobei Solr nicht selbst als Suchoberfläche für Benutzer gedacht ist, sondern hierfür eine separate Software, in unserem Fall VuFind, bereitgestellt wird.

In einer Gruppenübung haben wir anschliessend die Suchausgabe in VuFind mit der Suchausgabe über die Query-Abfrage der Administrations-Oberfläche von Solr verglichen. Gleichzeitig sollten die Abfragen in der Logdatei von Solr im Terminal beobachtet werden. Es zeigte sich, dass in Solr und VuFind mit dem Suchbegriff «Psychology» die gleiche Anzahl Treffer gefunden werden konnte. In meiner Gruppe fiel zudem auf, dass die Abfrage in VuFind im Terminal einen kaum leserlichen und langen Output bringt, wohingegen der Output von Solr doch eher menschenlesbar ist. Wie uns anschliessend erklärt wurde, hängt das damit zusammen, dass VuFind bei der Sucheingabe Autovervollständigung nutzt, welche wiederum Output im Terminal erzeugt. Interessant fand ich, dass bei der Suche über VuFind automatisch ein Relevanzranking der Ergebnisse durchführt wird, was wiederum im Terminal beobachtet werden kann. Dass ein Ergebnis höher gewichtet wird, sofern der Suchbegriff in einem entsprechenden Feld vorkommt, lässt sich am Zeichen ^ gefolgt von einer Zahl z.B. 500 erkennen.

Terminal_x

Ausschnitt der Abfrage über VuFind im Terminal

Kommt der gesuchte Begriff beispielsweise im Feld Series vor, so wird das Resultat im vorliegenden Fall 100 Mal höher gewichtet als wenn der Begriff im Feld ISBN vorkommt (s. Bild oben). Solr vergleicht bei der Suchanfrage somit den eingegebenen Begriff mit den Feldern der vorliegenden Objekte und berechnet für alle Objekte eine Wertigkeit anhand welcher sie anschliessend ein Ranking der Treffer durchführt.

Eine weitere Übung bestand darin, Beispieldaten aus Archivesspace, DSpace, Koha und dem Directory of Open Access Journals (DOAJ) in VuFind zu importieren. Dies geschah mittels Kommandos im Terminal. Es zeigte sich, dass die von Archivesspace und DSpace erstellten Daten nicht importiert werden konnten, da in den Datensätzen das Feld «id» fehlt, welches aber für den Import obligatorisch ist.

Da mir Solr bisher unbekannt war, es doch sehr weit verbreitet und Grundlage für viele Suchkataloge und Discoverysysteme ist, war es spannend, einmal hinter die Kulissen schauen zu können. Einen etwas vertiefteren Einblick bezüglich der Funktionsweise von Solr wäre für das Verständnis jedoch hilfreich gewesen. So war mir beispielsweise nicht klar, wie denn nun der Suchindex aufgebaut wird und ob dieser bei jeder Suchabfrage neu erstellt wird oder ob hier immer auf den gleichen Index zurückgegriffen wird. Ich habe deshalb selbst noch weiterrecherchiert und konnte einige Antworten auf https://www.ionos.de/digitalguide/server/konfiguration/solr/ finden.

Quellen: Unterrichtsskript BAIN HS21 ISc18tzZ Tag 8 (17.12.); Unterrichtseinheit Tag 8