Tällä hetkellä olen muuntamassa Helsingin kirjaston luokittelujärjestelmää SKOS-muotoon erilaisin XSL-muunnoksin. Tuo luokittelujärjestelmä (siis juurikin se, miten kirjaston kirjat ovat luokiteltu hyllyihin) on hyvä esimerkki luonteeltaan ontologisesta datasta. Esimerkiksi luokan 100 Filosofia alla on luokka 108.2 Itämainen filosofia. Itämaisesta filosofiasta on taas viittaavia luokkia mm. luokkaan 280 Ei-kristilliset uskonnot ja mytologiat, josta voi lukea mm. Ananda Margasta, Hare Krishnasta ja transsendenttisesta mietiskelystä!
Eikös olekin kiinnostavaa? Jos en mitään muuta tämän työn aikana opi, niin ainakin nuo kirjastojen luokat tulevat vähän tutummiksi.
Jaa niin, mikä ihmeen SKOS ja miksi tässä ollaan muuntamassa mitään?
W3C sanoo Simple Knowledge Organisation System (SKOS):sta:
SKOS is an area of work developing specifications and standards to support the use of knowledge organisation systems (KOS) such as thesauri, classification schemes, subject heading lists, taxonomies, other types of controlled vocabulary, and perhaps also terminologies and glossaries, within the framework of the Semantic Web.
Lyhyesti sanottuna SKOS:n avulla voi määritellä esimerkiksi juuri tuollaisen luokittelujärjestelmän sisäisiä semanttisia suhteita, kuten "laajempi termi", "suppeampi termi" ja "liittyvä termi". Muunnos SKOS-muotoon tehdään siksi, että siinä missä tuota HKLJ-webbisaittia pystyy ihminen hyvin lukemaan ja käyttämään, ei koneet ymmärrä tuosta mitään. Tällä hetkellä HKLJ:n data on olemassa vain litteänä XML-dumppina (tai sellaisen minä ainakin sain työstettäväkseni), josta termien semanttisia suhteita ei kovin helposti saa ulos, jos niitä ylipäänsä on edes mitenkään järkevästi kuvattu.
Kommentit