Vantaan Energia
30 000 dokumentin suosta siistiksi ja viitoitetuksi moottoritieksi – tiedonlouhinnalla kohti hallittua kokonaisuutta
Kesällä 2025 käynnistynyt hanke Vantaan Energian kanssa lähti liikkeelle hyvin käytännöllisestä tarpeesta. Hajautuneesti eri ympäristöihin ja verkkolevyille vuosien aikana kertynyt dokumenttimassa haluttiin siirtää uuteen dokumentinhallintajärjestelmään. Ennen siirtoa dokumentit piti kuitenkin luokitella ja metatiedottaa niin, että ne istuvat suoraan uuden järjestelmän rakenteeseen.
Dokumentteja oli noin 30 000, ja ne sisälsivät teknisiä ohjeita, piirustuksia, raportteja ja muuta asiantuntijamateriaalia. Tieto oli dokumenttien sisällä, ei rakenteisena metatietona. Pelkkä kansiorakenne tai tiedostonimi ei kertonut riittävästi siitä, mitä dokumentti sisälsi, kuka sen oli tuottanut tai mihin kokonaisuuteen se kuului, vaan tämän ymmärtääkseen piti dokumentti avata, ja etsiä oikeat kohdat.
Tavoitteena oli muodostaa dokumenteille metatietorakenne, joka vastaa tulevan dokumentinhallintajärjestelmän vaatimuksia ja mahdollistaa tehokkaan haun, luokittelun ja jatkokäytön. Palveluntarjoajan valinnan kohdistuminen DOCiin oli pitkälti kiinni tekoälyratkaisun tarjoamisesta tähän työhön – kartoitusvaiheessa kun työ vielä suunniteltiin manuaalisesti tehtäväksi.
”Dokumenttien manuaalisen metatiedottamisen sijaan työtunteja voitiin nyt keskittää kehittävämpiin ja mielekkäämpiin tehtäviin, kuin Excelissä tietojen lisäilyyn”, kertoo Vantaan Energian tuotantopalveluiden kehityspäällikkö Roni Burtsov.
Työ aloitettiin siirtämällä dokumentit louhintaympäristöön. Asiakas valitsi esimerkkiaineistoa eri dokumenttityypeistä ja -luokista, joiden pohjalta tekoälyratkaisua opetettiin tunnistamaan olennaiset tiedot. Näitä olivat muun muassa:
- dokumenttityyppi, jonka perusteella dokumentti luokiteltiin
- dokumentin tuottaja, tässä tapauksessa huoltoraportin tuottanut yritys
- tilaaja
- päiväys
- mahdollinen laitetunnus
Tunnistetut tiedot sidottiin suoraan asiakkaan dokumentinhallinnan metarakenteeseen. Näin louhinta tuotti irrallisen datan sijaan valmiin pohjan järjestelmään siirrettävälle metatiedolle.
Opetusvaiheen jälkeen mallia tarkennettiin useassa vaiheessa ja lähestymistapaa sekä kielimallivalintaakin hiottiin projektin aikana. Aineisto oli sisällöltään vaihtelevaa ja teknisesti monimuotoista, joten tunnistustarkkuutta parannettiin testien ja yhteisen läpikäynnin kautta. Kun lopputulos vastasi vaatimuksia, dokumenttimassa louhittiin erissä ja siirrettiin asiakkaan dokumentinhallintajärjestelmään validoitavaksi samalla, kun seuraavaa erää valmisteltiin.
Haaste
Laaja ja sisällöltään vaihteleva dokumenttimassa piti saada luokiteltua, tyypitettyä ja rikastettua metatiedoin ennen siirtoa uuteen dokumentinhallintajärjestelmään. Metatiedot puuttuivat tai olivat epäyhtenäisiä, eikä dokumentteja voitu luokitella luotettavasti ilman sisällön läpikäyntiä.
Manuaalinen vaihtoehto olisi tarkoittanut sitä, että joku avaa dokumentin toisensa jälkeen, etsii tarvittavat tiedot ja kirjaa ne järjestelmään käsin. Työ olisi ollut hidasta, kallista ja altista virheille.
Hyödyt
- Sisältöpohjainen luokittelu: Dokumentit luokiteltiin niiden todellisen sisällön perusteella, ei kansiorakenteen tai tiedostonimen mukaan.
- Metatieto valmiiksi järjestelmää varten: Louhittu tieto vastasi suoraan dokumentinhallinnan metarakennetta, mikä teki siirrosta sujuvan ja vähensi jälkityötä. Dokumentinhallintajärjestelmään siirrettiin luokiteltu ja hakukelpoinen kokonaisuus.
- Melkein puolikas henkilötyövuosi säästetty: Automaattinen tiedonlouhinta korvasi laajan manuaalisen käsittelytyön – jos ihmisellä olisi kulunut keskimäärin yhden dokumentin avaamiseen, silmäilyyn, metatietojen tunnistamiseen ja kirjaamiseen sekä tallentamiseen 1,5 minuuttia, olisi työmäärä vastannut 100 päivää.
- Projektin myötä tekoäly vahvemmin käyttöön: Positiivisten kokemusten myötä tekoälyprojekteja on Vantaan Energialla suunnitelmissa useampia – kiinnostus AI:n mahdollisuuksista heräsi laajemminkin.
Hankkeen myötä aiemmin jäsentymätön dokumenttikokonaisuus muuttui rakenteiseksi ja hallittavaksi. Tiedonlouhinta mahdollisti sen, että dokumenttien arvo saatiin näkyväksi – ja valmiiksi hyödynnettäväksi uudessa ympäristössä.
”Yhteistyö DOCin kanssa oli rehellistä ja joustavaa – haasteista uskallettiin puhua, ja tilannekuva pysyi hyvin yllä”, kiittää Burtsov.
Lasketaanko teidän sopimustenhallinnan kustannuksianne? Lataa oppaamme!