Kehitä kirjastosi palveluja datan avulla

Hyvänä esimerkkinä massadatan hyödyntämisestä kirjastoissa on paikkatiedon ja paikannusdatan testaus palveluiden kehittämisessä. Paikkatietoa voidaan hyödyntää esimerkiksi kirjastojen saavutettavuuden suunnittelussa ja kirjaston käytön ja käyttäjien analysoinnissa: millainen väestöpohja alueella on ja miten alueella liikutaan? Kirjasto voisi pyrkiä tuomaan joko kiinteitä tai liikkuvia ja jalkautuvia kirjastopalveluja sinne, missä niille on eniten tarvetta tai missä väkeä liikkuu taajaan. Kirjaston palveluverkkoa voitaisiin myös analysoida väestödatan ja erilaisten demografisten tietojen pohjalta, mm. hyvinvointieroihin liittyvien indikaattoreiden pohjalta.  

Kirjaston tilojen sisälle paikannusdata voidaan tuoda tilaa havainnoivilla sensoreilla. Niiden avulla voidaan seurata jatkuvalla otannalla, kuinka paljon tiloissa liikkuu ihmisiä ja missä tilojen osissa he vierailevat. Kirjaston asiakasta voidaan myös opastaa oikeaan paikkaan sisätilapaikannuksella ja sisätilakarttasovelluksella.

eOppivan johdanto paikkatiedon hyödyntämiseen.

Turun kaupunginkirjasto muodosti paikannus- ja suosittelupalveluhankkeessaan lainadatasta anonyymejä aineistopinoja, joiden välille tietokoneohjelma etsi verkostomaisia yhteyksiä. Esimerkiksi Aku Ankan, Kepler62:n ja Minecraft-oppaan välille muodostuu yhteys, vaikka niiden kuvailu- ja sijaintitiedoissa ei ole juuri mitään yhteistä. Palvelun avulla asiakas löytää ihannetapauksessa paitsi etsimänsä, myös sen mitä ei tiennyt etsivänsä. Suosittelualgoritmien taustalla on tieto lainassa olevasta aineistosta, niteiden sijaintitiedot ja kuvailutiedot – mutta mikä erittäin tärkeää, ei käyttäjän tunnistamista.  

Gisposition kehittämä Palveluympäristön raportointipalvelu käyttää taustanaan Turun hankkeen kanssa samaa automatisoitua prosessia, jolla tarvittava laina- ja metadata poimitaan kirjastojärjestelmästä. Kirjastodataa rikastetaan väestödatalla ja tulokset visualisoidaan karttapohjalle ja tilastokaavioiksi verkkopalveluun. Raportointipalvelusta selviää kunkin kirjaston paikallisen vaikutusalueen väestö- ja asiakasrakenne, asiointitottumukset ja valikoiman soveltuvuus paikallisen väestön kiinnostuksenkohteisiin, sekä kuinka hyvin kirjaston palveluverkko on onnistunut tavoittamaan paikallisen väestön. Tietoja voidaan käyttää hyödyksi mm. palveluverkon ja palvelun saatavuuden suunnitteluun, palvelujen markkinointiin ja kohdentamiseen eri ryhmille sekä kirjastojen profilointiin. 

Kirjaston laina-, varaus-, kokoelma- ja kävijädatasta voi saada irti monella tapaa palvelujen kehittämistä tukevaa tietoa. Asiakaspalvelun resursointi, työvuorosuunnittelu ja aukioloaikojen optimointi voi perustua käyttö- ja kävijätietoon, jossa on aikaleimat. Tilauudistuksessa tai uudiskohteessa voidaan ennakoida tarvittavien lainaus- ja palautusautomaattien ja asiakaspäätteiden määrää vastaavien tai aiempien kohteiden volyymien perusteella. 

Varaus- ja lainadatan perusteella voidaan kehittää kokoelmapolitiikkaa kustannustehokkaammaksi ja asiakaslähtöisemmäksi. Voidaan vertailla eri toimipisteitä keskenään ja todeta missä on eniten kasvua ja tehdä siitä tarvittavia johtopäätöksiä: mikä palvelumalli vetää parhaiten paikallisesti? Jo nyt tutkitaan rutiininomaisesti nidetiedoista, koska se on elinkaarensa päässä ja valmis poistettavaksi tai mihin nimekkeisiin on niin paljon varauksia, että lisähankinta on paikallaan. Muustakin data-analyysistä täytyisi tehdä samalla tavalla kätevää ja arkista helppokäyttöisillä työkaluilla.

Hankaluutena big datan hyödyntämisessä on datan käsittelyyn tarvittavien uusien työvälineiden opettelu. Suurissa kaupungeissa voi olla kirjastojenkin käytössä kaupungin tietojohtamispalvelu analyytikoineen, mutta muualla saatetaan olla ostopalvelujen tai oman osaamisen kehittämisen varassa. Suurehkoja datamassoja pystyy tiettyyn pisteeseen asti käsittelemään Excelilläkin, mutta jo yhden vuoden lainatapahtumat ylittävät tavallisen taulukkolaskentaohjelman suorituskyvyn, jolloin data pitää jakaa osasiin. Ohjelmoimalla, Power Queryä käyttämällä ja luovasti soveltamalla Excelinkin kanssa pääsee pitkälle tietojen etsimisessä, yhdistämisessä ja jalostamisessa eri lähteistä, kuten tiedostoista, verkkosivuilta, tietokannoista tai hajautetuista big data -tietojärjestelmistä. Excelin jälkeen yleisimmistä työvälineistä Power BI on tällä hetkellä seuraava looginen askel suurempien datamäärien käsittelyyn, analyysiin ja visualisointiin. Osaamisen kehittämiseen kannattaa todella satsata: kirjaston data-analyysin saa hyvin kustannustehokkaasti vietyä aivan uudelle tasolle.

Yhtenä esteenä tekoälyjärjestelmien kehittämiselle tai hankkimiselle on pidetty myös niiden kalleutta. Valmiit tuotteet ja ohjelmointiyrityksiltä tilattavat custom-ratkaisut voivat ylittää kirjaston budjetin ja kehittämisavustukset, mutta vaihtoehtojakin on. Vaikkapa oppilaitosyhteistyöllä voi saada aikaiseksi molempia osapuolia hyödyttäviä käytännön sovellutuksia analyysi- ja tekoälyteknologioista.

Tietojärjestelmien tuottaman datan hyödyntäminen :: Verkkopalvelujen analytiikalla parempaan käyttökokemukseen