Novinky z oblasti Polytematického strukturovaného hesláře

Obr.

Obr. 1: Logo Polytematického strukturovaného hesláře

Polytematický strukturovaný heslář je česko-anglický řízený slovník lexikálních jednotek. Je rozdělen do 44 tematických skupin, v nichž jsou hesla dále hierarchicky členěna. PSH slouží k vyjádření věcného obsahu dokumentů a jejich zpětnému vyhledání, může být používán také samostatně jako zdroj deskriptorů pro předmětové katalogy knihoven. Vznikal od roku 1991 ve Státní technické knihovně v Praze (STK). Cílem tvůrců PSH bylo vybudovat nástroj blízký přirozenému jazyku, jenž by doplnil nebo částečně nahradil stávající klasifikační systémy a ve finále také zkvalitnil vyhledávání v knihovních databázích. V listopadu 2006 byl implementován do autoritní databáze systému Aleph. Stávající verze PSH 2.1 je tedy dostupná ve formátu MARC21 pro autority. V současnosti PSH obsahuje více než 13 500 hesel.

V roce 2009 došlo v oblasti PSH k několika významným změnám. Ty navazují na jednání Rady pro koordinaci Polytematického strukturovaného hesláře (Rada PSH) z prosince 2008. Rada PSH se schází pravidelně koncem kalendářního roku v STK. Jejími členy jsou kromě externích odborníků a odborníků z STK také zástupci uživatelských knihoven. Rada PSH se vyjadřuje k problematice hesláře, hodnotí dosavadní aktivity, doporučuje nová řešení, případně předkládá návrhy na zdokonalení PSH a způsoby jeho využití. K novinkám patří např. zřízení webového formuláře pro návrh nového hesla PSH, uvolnění PSH v rámci licence Creative Commons a převedení PSH do formátu SKOS.

Návrh nového hesla PSH

V souvislosti s řešením problematiky aktualizací PSH se mimo jiné otevřela otázka, jak mohou uživatelské knihovny a odborná veřejnost přispět k revizím PSH. V katalogizační praxi STK a knihoven používajících PSH se někdy setkáváme se situací, kdy se při věcném popisu dokumentů objevují termíny, jež v posledních aktualizacích PSH zatím nebyly zohledněny. Rychlé zastarávání termínů je typickým problémem všech heslářů, které mají pevnou strukturu i obsah. Proto byl vytvořen jednoduchý webový formulář pro návrh nového hesla PSH, který je určen jak externím uživatelům, tak katalogizátorům STK. Získané návrhy pracovníci Referátu PSH shromažďují a v pravidelných intervalech budou zvažovat jejich zařazení do struktury PSH. Ne vždy však navrhovaný termín znamená nutnost vytvoření nového hesla, vyskytnout se mohou i takové, které nemají pro rozšíření struktury hesláře význam. Proto pracovníci Referátu PSH ve spolupráci s katalogizátory STK, případně s odborníky z jednotlivých oborů u získaných návrhů zvažují účelnost hesel, popř. kontrolují jejich duplicitu.

Obr. 2: Formulář pro návrh nového hesla

Obr. 2: Formulář pro návrh nového hesla

Sekci „Návrh nového hesla“ naleznete na stránkách PSH. Zde uvítáme také návrhy zainteresovaných čtenářů časopisu Ikaros.

PSH a Creative Commons

Vznik licencí Creative Commons souvisí zejména s řešením otázky, jak chránit autorská díla a zároveň umožnit jejich užívání. Creative Commons nejsou popřením klasického pojetí copyrightu, ale jeho nadstavbou.

O licencích Creative Commons (CC licence) bylo podrobněji pojednáno v článku L. Grubera „Licence Creative Commons a perspektiva jejich zavedení do českého prostředí“, který vyšel loni v Ikarovi (roč. 12, č. 3). Autor si v tomto článku kladl otázku, zda se uskuteční překlad CC licencí do českého jazyka. Necelý rok poté (16. 4. 2009), především díky iniciativě pracovní skupiny pro vytvoření českých licencí, byla česká verze licencí CC zveřejněna.

Uvolnění PSH v rámci licence Creative Commons představuje jeden z prostředků jeho širšího využití, které umožní jeho šíření mezi dalšími uživateli. Zároveň by se PSH mohl stát atraktivnější pro uživatele internetu, tedy pro širší komunitu, než je ta knihovnická.

Návrh zveřejnit PSH pod licencí Creative Commons byl schválen bezprostředně po uvedení české verze CC licencí. PSH ve formátu SKOS je uvolněn konkrétně pod licencí CC BY NC SA - Uveďte autora Neužívejte dílo komerčně Zachovejte licenci 3.0 Česko.

V praxi to znamená, že STK umožňuje ostatním PSH/SKOS kopírovat, distribuovat, sdělovat veřejnosti a zároveň umožňuje PSH/SKOS upravovat a doplňovat, avšak za podmínek, že toto dílo nesmí být využito pro komerční účely; dále je nutné uvést údaje o autorovi a tomto díle. Pokud bude PSH/SKOS jakkoliv upraven nebo použit v jiném díle, vzniká tím povinnost výsledek odvozené práce šířit pod stejnou nebo slučitelnou licencí.

Nový nástroj pro prohlížení PSH

V červnu 2009 byl na stránkách Státní technické knihovny zpřístupněn nástroj pro prohlížení PSH a jeho distribuci ve formátu SKOS. Tento nástroj umožňuje navigaci heslářem pomocí postupu od obecných ke specifickým heslům nebo pomocí vyhledávání. Současně je možné získat přístup k jednotlivým heslům nebo celému hesláři ve strojově čitelné formě, kterou představuje formát SKOS.

SKOS

Po rozhodnutí zveřejnit PSH pod některou z licencí Creative Commons byla řešena otázka, v jakém formátu PSH nabídnout. Hlavní formát, v němž je PSH zachycen, je MARC pro autoritní záznamy. Ten je sice zaveden v software pro knihovny, ale nehodí se pro webovou distribuci. Vzhledem k požadavku na interoperabilitu měl být zvolený formát založený na standardu XML (eXtensible Markup Language).

Po zvážení použití formátu MADS (Metadata Authority Description Schema) pro autoritní záznamy a možnosti napsat si vlastní XML schéma byl navržen formát SKOS (Simple Knowledge Organization System).

SKOS je jednoduchý formát určený pro reprezentaci, sdílení a odkazování znalostních systémů, jako jsou tezaury, klasifikační schémata nebo řízené hesláře. Je založen na standardech konsorcia W3C RDF (Resource Description Framework) a RDFS (RDF Schema) a vzhledem k tomu je možné jej používat v kombinaci s dalšími RDF formáty. SKOS je od března 2009 navržen jako kandidát na doporučení W3C.

Pro strojově čitelné vyjádření licence Creative Commons byl použit jazyk Creative Commons Rights Expression Language (ccREL), který je rovněž založen na RDF, a proto je možné jej začlenit do mnoha dalších formátů (XHTML, XML, SKOS aj.).

Inspirací pro převod a způsob distribuce PSH ve formátu SKOS byly již existující aplikace jazyka SKOS v jiných knihovnách. Jako jedna z prvních knihoven použila SKOS pro své věcné autority Švédská národní knihovna (příklad předmětového hesla). Jiným příkladem je Tezaurus pro ekonomii Německé národní ekonomické knihovny. V květnu 2009 byla v tomto formátu oficiálně zveřejněna také předmětová hesla Kongresové knihovny (Library of Congress Subject Headings), která v předchozí neoficiální podobě na lcsh.info představovala průkopnické použití linked data v oblasti knihoven.

Data PSH ve formátu SKOS jsou k dispozici jako dávkový export, který je volně ke stažení pod podmínkami licenčního ujednání Creative Commons. Prioritou však bylo zveřejnění hesláře v souladu se čtyřmi principy linked data, což v případě PSH zahrnuje:

  • Použití URI (Uniform Resource Identifier) jako identifikátorů hesel.
  • Použití HTTP (Hypertext Transfer Protocol) URI, takže je možné si hesla prohlédnout pomocí webového prohlížeče.
  • Poskytnutí užitečných informací u hesla.
  • Zahrnutí odkazů na další zdroje.

Zpřístupnění

PSH je zpřístupňován pomocí webového rozhraní na adrese http://www.stk.cz/cs/katalogy-a-databaze/psh/prohlizeni-psh/. Na výchozí stránce je zobrazen výčet 44 základních tematických řad vyjádřených hesly PSH. Ta jsou hierarchicky dále řazena od nejobecnějších k nejvíce specifickým. Lze vyhledávat také v preferovaných nebo nepreferovaných zněních hesel.

Hesla PSH jsou na stránkách v první řadě zobrazena v jejich preferovaném znění. Stejně tak jsou uvedena znění nepreferovaná. Důležitým údajem je URI, které představuje jedinečný identifikátor hesla. Vzhledem k dvoujazyčné povaze PSH je také uvedena anglická verze hesla. Zařazení hesla do struktury PSH je zachyceno jeho vztahy nadřazenosti, podřazenosti a příbuznosti.

Díky identifikaci jednotlivých hesel pomocí URI, lze jednoduše vytvářet vazby na externí data. V případě PSH to znamená, že u některých hesel lze nalézt odkazy na Library of Congress Subject Headings a DBPedii, která představuje části Wikipedie ve formě linked data.

Poslední údaj uváděný na stránkách hesel je přímý odkaz na XML serializaci hesla ve formátu SKOS. Kromě tohoto způsobu lze získat záznam hesla ve formátu SKOS také při zadání HTTP požadavku na URI hesla s hlavičkou obsahující Accept:application/rdf+xml. Tento způsob vychází z doporučených řešení pro distribuci linked data.

Kromě textového zobrazení se u jednotlivých hesel nachází jejich vizualizace, která zachycuje strukturu vazeb se sousedícími hesly. Vazby jsou určeny pozicí a ikonami hesel. Vizualizace obsahuje hypertextové odkazy, takže umožňuje interaktivní navigaci heslářem.

Obr. 3: Ukázka vizualizace

Obr. 3: Ukázka vizualizace

Toto webové rozhraní zároveň vytváří sekundární přístupový bod k fondům STK. U jednotlivých hesel jsou prezentovány záznamy dokumentů indexovaných těmito hesly, které se nacházejí ve sbírkách STK. Ty obsahují přímé odkazy do katalogu STK, což umožňuje zadat přímý požadavek na výpůjčku nebo rezervaci. U každého záznamu je pomocí ikony uvedena forma dokumentu a v některých případech také obrázek obálky.

Další rozšiřování možností přístupu a využití PSH se bude odvíjet zejména podle toho, jaké způsoby využití těchto dat se objeví. To znamená především implementaci dalších datových formátů, případně rozšiřování vazeb na další znalostní systémy.

Pokud máte zájem o informace z oblasti PSH, přihlaste se prosím do elektronické konference PSH (pshkonference@stk.cz) nebo sledujte webové stránky PSH. Dotazy vám rádi zodpovíme i na e-mailové adrese psh@stk.cz.

Použité zdroje:
  1. BERNERS-LEE, Tim. Linked data : design issues [online]. Last change 2007-05-02 [cit. 2009-06-10]. Dostupný z WWW: <http://www.w3.org/DesignIssues/LinkedData.html>.
  2. Cool URIs for the semantic web : W3C working draft [online]. 17 December 2007 [cit. 2009-06-10]. Dostupný z WWW: <http://www.w3.org/TR/2007/WD-cooluris-20071217/>.
  3. Creative Commons Česká republika [online]. c2009 [cit. 2009-06-08]. Dostupný z WWW: <http://www.creativecommons.cz/>.
  4. Creative Commons [online]. [cit. 2009-06-08]. Dostupný z WWW: <http://creativecommons.org/>.
  5. Gruber, Lukáš. Licence Creative Commons a perspektiva jejich zavedení do českého prostředí. Ikaros [online]. 2008, roč. 12, č. 3 [cit. 2009-06-08]. Dostupný z WWW: <http://www.ikaros.cz/node/4612>. URN-NBN:cz-ik4612. ISSN 1212-5075.
  6. SKOS Simple Knowledge Organization System [online]. Last updated 2009-03-18 [cit. 2009-06-10]. Dostupný z WWW: <http://www.w3.org/2004/02/skos/>.
Kamrádková, Kateřina; Kožuchová, Kristýna; Mynarz, Jindřich. Novinky z oblasti Polytematického strukturovaného hesláře. Ikaros [online]. 2009, roč. 13, č. 7 [cit. 23.09.2014]. Dostupný na World Wide Web: <http://www.ikaros.cz/node/5591>. urn:nbn:cz:ik‐005591. ISSN 1212-5075.
Průměr: 5 (1 vote)

automaticky generované reklamy