Multilinguale semantische Suche
Das finde ich total aufregend: Seit Beginn des Jahres entwickelt die junge Firma Avantgarde Labs zusammen mit der Sächsischen Landesbibliothek — Staats– und Universitätsbibliothek Dresden im Rahmen einer Public Private Partnership eine multilinguale semantische Katalogsuche — SLUBsemantics.
SLUBsemantics macht in einer ersten Ausbaustufe unsere etwa 4 Mio. lokalen Titeldaten auf eine Weise zugänglich, die weltweit einzigartig sein dürfte. Die in der SLUB inzwischen normale, auf der Grundlage von Suchmaschinentechnologie realisierte Indexsuche mit Rechtschreibkorrektur, Wortformennormalisierung, vielfältigen Drill-down-Möglichkeiten und einstellbaren Sortierkriterien kann letztlich nur ausgeben, was über ein Matching der Suchanfrage mit den beschreibenden Informationen in den Titeldaten herausgefiltert wird. Titel, die mit anderssprachigen oder synonymen Deskriptoren erschlossen sind, können gewöhnlich nur durch eine entsprechende Formulierung der Suchanfrage berücksichtigt werden. Sonstige semantische Relationen zwischen den Deskriptoren fehlen zu großen Teilen ganz. Das deshalb von vielen Nutzern bevorzugte thematische Browsing, kann in seiner gewöhnlich anzutreffenden Form aufgrund der inkonsistenten Erschließung der Titel jedoch meist nur einen Ausschnitt des gesamten Bestandes einer Bibliothek abdecken. SLUBsemantics erfasst hingegen alle lokalen Katalogdaten und ermöglicht die Eingabe der Suchbegriffe in derzeit drei Sprachen: Deutsch, Englisch und Polnisch. Semantische Beziehungen zwischen den Themen werden als Verzweigungsstrukturen dargestellt.
Die fast magisch wirkende Funktionsweise von SLUBsemantics ist Resultat eines so einfachen wie einleuchtenden Prinzips – des Rückgriffs auf große, sozial gepflegte und netzwerkartig angelegte Informationsstrukturen zum Zweck der automatischen Anreicherung und Verknüpfung von Katalogdaten. Wir bedienen uns dabei u.a. des größten sozial erzeugten Informationsnetzwerk, das die Menschheit bislang erschaffen hat, der freien Enzyklopädie „Wikipedia“. Die Software erkennt automatisch den inhaltlichen Zusammenhang der Suchanfrage und gibt strukturierte Trefferlisten aus. Gibt der Benutzer zum Beispiel das Wort „Bank“ ein, werden ihm sowohl relevante Katalogeinträge zu (einzelnen) Kreditinstituten, der Bankenkrise oder dem Eurosystem als auch zum Sitzmöbel, einer Sandbank oder zur Uferschwalbe, einer typischen Bewohnerin von Uferregionen, vorgeschlagen. Sucht er „Hauptstadt Belgien“, werden auch alle Treffer mit „Brüssel“ berücksichtigt. Lautet die Eingabe „Gone with the wind“, erhält er zugleich Treffer zum deutschen Filmtitel „Vom Winde verweht“, zum Regisseur Victor Fleming, zu Max Steiner, dem Komponisten der Filmmusik, und zu Margaret Mitchell, der Autorin des Vorlage-Romans.
Die Veröffentlichung der Beta-Version ist für den 15. Dezember vorgesehen. Momentan befinden wir uns in der Phase eines geschlossenen Beta-Tests. Wir laden Interessierte ein, an dieser Closed Beta teilzunehmen und uns Hinweise, Meinungen und Kritik zurückzuliefern, so dass wir die Anreicherungsalgorithmen feiner stimmen und SLUBsemantics bis zum offiziellen Start weiter verbessern können.
Weitere Erläuterungen und Einzelheiten zur Teilnahme am Test finden Sie in einem Blog-Post von Achim Bonte im SLUBlog.