0

Multilinguale semantische Suche

Posted by jmiba on November 24, 2011 in Informationstechnologie |

Das finde ich total auf­re­gend: Seit Beginn des Jah­res ent­wi­ckelt die junge Firma Avant­garde Labs zusam­men mit der Säch­si­schen Lan­des­bi­blio­thek — Staats– und Uni­ver­si­täts­bi­blio­thek Dres­den im Rah­men einer Public Pri­vate Part­nership eine mul­ti­lin­guale seman­ti­sche Kata­log­su­che — SLUBsemantics.

SLUB­se­man­tics macht in einer ers­ten Aus­bau­stufe unsere etwa 4 Mio. loka­len Titel­da­ten auf eine Weise zugäng­lich, die welt­weit ein­zig­ar­tig sein dürfte. Die in der SLUB inzwi­schen nor­male, auf der Grund­lage von Such­ma­schi­nen­tech­no­lo­gie rea­li­sierte Index­su­che mit Recht­schreib­kor­rek­tur, Wort­for­mennor­ma­li­sie­rung, viel­fäl­ti­gen Drill-down-Möglichkeiten und ein­stell­ba­ren Sor­tier­kri­te­rien kann letzt­lich nur aus­ge­ben, was über ein Matching der Such­an­frage mit den beschrei­ben­den Infor­ma­tio­nen in den Titel­da­ten her­aus­ge­fil­tert wird. Titel, die mit anders­spra­chi­gen oder syn­ony­men Deskrip­to­ren erschlos­sen sind, kön­nen gewöhn­lich nur durch eine ent­spre­chende For­mu­lie­rung der Such­an­frage berück­sich­tigt wer­den. Sons­tige seman­ti­sche Rela­tio­nen zwi­schen den Deskrip­to­ren feh­len zu gro­ßen Tei­len ganz. Das des­halb von vie­len Nut­zern bevor­zugte the­ma­ti­sche Brow­sing, kann in sei­ner gewöhn­lich anzu­tref­fen­den Form auf­grund der inkon­sis­ten­ten Erschlie­ßung der Titel jedoch meist nur einen Aus­schnitt des gesam­ten Bestan­des einer Biblio­thek abde­cken. SLUB­se­man­tics erfasst hin­ge­gen alle loka­len Kata­log­da­ten und ermög­licht die Ein­gabe der Such­be­griffe in der­zeit drei Spra­chen: Deutsch, Eng­lisch und Pol­nisch. Seman­ti­sche Bezie­hun­gen zwi­schen den The­men wer­den als Ver­zwei­gungs­struk­tu­ren dargestellt.

Die fast magisch wir­kende Funk­ti­ons­weise von SLUB­se­man­tics ist Resul­tat eines so ein­fa­chen wie ein­leuch­ten­den Prin­zips – des Rück­griffs auf große, sozial gepflegte und netz­werkar­tig ange­legte Infor­ma­ti­ons­struk­tu­ren zum Zweck der auto­ma­ti­schen Anrei­che­rung und Ver­knüp­fung von Katalogdaten. Wir bedie­nen uns dabei u.a. des größ­ten sozial erzeug­ten Infor­ma­ti­ons­netz­werk, das die Mensch­heit bis­lang erschaf­fen hat, der freien Enzy­klo­pä­die „Wikipedia“. Die Soft­ware erkennt auto­ma­tisch den inhalt­li­chen Zusam­men­hang der Such­an­frage und gibt struk­tu­rierte Tref­fer­lis­ten aus. Gibt der Benut­zer zum Bei­spiel das Wort „Bank“ ein, wer­den ihm sowohl rele­vante Kata­log­ein­träge zu (ein­zel­nen) Kre­dit­in­sti­tu­ten, der Ban­ken­krise oder dem Euro­sys­tem als auch zum Sitz­mö­bel, einer Sand­bank oder zur Ufer­schwalbe, einer typi­schen Bewoh­ne­rin von Ufer­re­gio­nen, vor­ge­schla­gen. Sucht er „Haupt­stadt Bel­gien“, wer­den auch alle Tref­fer mit „Brüs­sel“ berück­sich­tigt. Lau­tet die Ein­gabe „Gone with the wind“, erhält er zugleich Tref­fer zum deut­schen Film­ti­tel „Vom Winde ver­weht“, zum Regis­seur Vic­tor Fle­ming, zu Max Stei­ner, dem Kom­po­nis­ten der Film­mu­sik, und zu Mar­ga­ret Mit­chell, der Auto­rin des Vorlage-Romans.

Die Ver­öf­fent­li­chung der Beta-Version ist für den 15. Dezem­ber vor­ge­se­hen. Momen­tan befin­den wir uns in der Phase eines geschlos­se­nen Beta-Tests. Wir laden Inter­es­sierte ein, an die­ser Clo­sed Beta teil­zu­neh­men und uns Hin­weise, Mei­nun­gen und Kri­tik zurück­zu­lie­fern, so dass wir die Anrei­che­rungs­al­go­rith­men fei­ner stim­men und SLUB­se­man­tics bis zum offi­zi­el­len Start wei­ter ver­bes­sern können.

Wei­tere Erläu­te­run­gen und Ein­zel­hei­ten zur Teil­nahme am Test fin­den Sie in einem Blog-Post von Achim Bonte im SLUBlog.

Tags: , , , , , ,

Want to leave a note? Just fill in the form below.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Copyright © 2011-2013 Minority Report All rights reserved.
This site is using the Desk Mess Mirrored theme, v2.2, from BuyNowShop.com.