Tietojärjestelmien tuottaman datan hyödyntäminen

Big data eli massadata tarkoittaa yleisesti erittäin laajoja ja automaattisesti kertyviä tietojoukkoja. Keräyksessä voidaan hyödyntää erilaisia sensoritekniikoita (esimerkiksi lämpötilan jatkuva mittaus eri pisteissä) tai datan keräämistä ihmisten toiminnasta (sosiaalinen massadata). Tällaiset datajoukot ovat suuruutensa lisäksi yleensä moniulotteisia ja mahdollistavat täysin uudentyyppisiä analyyseja tehokkailla laskentamenetelmillä. 

Koneoppimisen avulla voidaan esim. hallita kirjaston (kelluvaa) kokoelmaa, muodostaa kirjastoille yksilöllisiä profiileja ja automatisoida aineiston tasaus niiden välille. Kunkin kirjaston kysyntää mahdollisimman hyvin vastaavan kokoelmaprofiilin ajatellaan maksimoivan lainauksen ja aineiston kierron ja lyhentävän halutun aineiston hyllyssä seisomisen tai kuljetettavana olemisen aikaa.  

Koneoppimisen kautta muodostettu kokoelmaprofiili voi myös auttaa aineistohankinnassa. Tavoitteena voisi olla löytää sopiva tasapaino kysyntään perustuvan tarjonnan ja ei vielä kysytyn tarjonnan välillä. Kirjaston sivistystehtävään kun nähdään sopivan huonosti se, että hankittaisiin aineistoa pelkästään senhetkisen kysynnän mukaan. Samoin suosittelupalveluissa täytyy algoritmi säätää riittävän väljäksi tai muulla tavoin kompensoida ennalta-arvattavuutta niin, että se nostaa myös riittävästi yllättävää aineistoa ennakoimattomasti esille. Pienillä opetusaineistoilla ”ylioppimisen” riski muutenkin korostuu, jolloin lopputuloksista uhkaa tulla kaavamaisia. 

Big data antaa pohjan monien uusien teknologioiden käyttöön kirjastossa: koneoppiminen, ohjelmistorobotit ja analytiikka keskeisimpinä. Näitä teknologioita voidaan edelleen soveltaa asiakasymmärryksen lisäämiseen, asiakaspalveluun, palvelujen optimointiin ja manuaalisen tai fyysisen työn vähentämiseen.  

Kirjastot ovat tähän saakka olleet melko varovaisia käyttämään asiakaskäyttäytymisdataa, jota kuitenkin kertyy kirjastojärjestelmiin miljoonia rivejä vuodessa. Kirjaston käyttö kuuluu yksityiselämän piiriin, joten tietojen anonymisointiin täytyy kiinnittää erityistä huomiota, varsinkin jos sitä jaellaan kirjasto-organisaation ulkopuolelle. Paras tapa hallita tätä on kerätä jo lähtökohtaisesti dataa anonyymisti tai hankkia ja suunnitella käytetyt tietojärjestelmät niin, että ne tekevät anonymisoinnin automaattisesti. Henkilökohtaisen eli nk. omadatan hallinnointi on puolestaan käyttäjän itsensä täysin päätettävissä. Omadataa voi hyödyntää esimerkiksi kännykkäsovelluksissa, jotka yhdistelevät henkilön itsensä hallitsemaa omadataa ja tietojärjestelmän tuottamaa massadatan analysointia. 

Teknisiäkin haasteita täytyy ylittää: osassa kirjastojärjestelmiä ei ole olemassa valmiita rajapintoja datan siirtämiseen ulos järjestelmästä vaikkapa analyysityökalujen lähteiksi ulkopuolisille palvelimille, joten siirto täytyy tehdä ihmiskäsin. Tietosuojan ja teknisten pulmien ei pitäisi kuitenkaan olla kompastuskivi, jos asiakasdataa halutaan hyödyntää, ja varhaisia esimerkkejä tästä jo onkin.

Tilastot ja kyselyt töihin :: Kehitä kirjastosi palveluja datan avulla

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out /  Muuta )

Google photo

Olet kommentoimassa Google -tilin nimissä. Log Out /  Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out /  Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out /  Muuta )

Muodostetaan yhteyttä palveluun %s