Hyppää sisältöön

Koneoppimisen käsikirja, osa 1: Miksi koneoppiminen epäonnistuu?

Koneoppiminen, Machine Learning, on täällä. Se helpottaa elämäämme ja tehostaa yritysten toimintaa. Mitä kannattaa ymmärtää, ennen kuin hyppää hehkutuksen mukana toteuttamaan koneoppimisen projekteja? Sofigaten data-analytiikan asiantuntija Jyrki Martti kertoo.

Koneoppimisesta lupaillaan suuria, esimerkiksi tällaista:

”Koneoppimisen avulla saat digitaalisen kaksosen, joka tekee tylsät työt puolestasi. Toteutuskin on helppoa, sillä sekä kaupallisissa työkaluissa ja avoimen lähdekoodin ohjelmointikirjastoissa on tarjolla suuri valikoima käyttövalmiita koneoppimisen algoritmeja. Et tarvitse välttämättä edes datatieteilijän apua! Riittää, että tunnistat liiketoiminnassa ratkaistavan haasteen. Sen jälkeen kuka vaan voi kehittää ja ottaa käyttöön kestävän koneoppimisratkaisun viikoissa tai jopa nopeammin.”

Kuulostaa lupaavalta, eikö? Jos koneoppiminen on näin helppoa, miksi yrityksesi ei ole ottanut sitä vielä käyttöön?

Koneoppiminen käyttöön: case tehdas

Aloitetaan liiketoiminnan haasteesta. Oletetaan, että otamme käyttöön koneoppimiseen perustuvan ratkaisun, joka valvoo tehtaamme koneita ja ilmoittaa meille etukäteen, jos jokin kone on menossa rikki.

Hypätään tarinassa eteenpäin: 10 kuukautta myöhemmin olemme käyttäneet satoja tuhansia euroja ja koneoppimisratkaisumme on valmis. Voimme nyt valvoa muun muassa lämpötilaa, kosteutta ja värinää sekä äänittää koneiden ääniä. Siirrämme jopa kaikki koneiden hälytykset ja datan pilveen data-altaaseemme.

Meillä on jo teratavuittain dataa, hienoja raportteja ja visualisointeja kaikista avaintiedoista. Datahan on tunnetusti kultaa.

Hieno juttu. Pystymmekö nyt arvioimaan, milloin koneemme pettävät?

No, yritämme ensin omien työntekijöidemme kanssa, mutta koneen vian ennustaminen osoittautuu vaativammaksi kuin odotimme. Pari viikkoa myöhemmin palkkaamme datatieteilijän yrityksen ulkopuolelta.

Datatieteilijä sanoo, että vikaantumisen ennustaminen on mahdotonta, jos emme pysty mallintamaan tilannetta, jossa vika tapahtuu. Hän neuvoo myös, että tarvitsemme tehtaan koneita ymmärtäviä asiantuntijoita selittämään, mitä tiedot tarkoittavat. Lisäksi hän puhuu jostain laskennallisesta ongelmasta, joka olisi ensin määriteltävä.

Datatieteilijän mielestä myös nykyistä tiedonkeruuprosessiamme on muutettava. Hänen mukaansa siitä puuttuu olennaisia tietoja, ja suurin osa data-altaamme sisällöstä voi olla hyödytöntä.

Suhtaudu hehkutukseen varauksella

Hetkinen! Eikö sinulle juuri kerrottu, että koneoppiminen on helppoa? Datatietelijöiden apuakaan ei pitänyt enää tarvita.

Kertomani tarina on fiktiivinen, mutta se sisältää silti totuuden siemenen. Vaikka koneoppiminen, tekoäly ja datatiede tarjoavat uusia ansainta- ja kustannussäästömahdollisuuksia, liiallinen hehkutus voi johtaa myös epäonnistuneisiin investointeihin.

Jotta koneoppiminen ei johda epäonnistumiseen, yksi tärkeimmistä asioista on tässä:

Ennen kuin etenet koneoppimisprojektissa, tunnista, mikä on olennainen liiketoimintaongelma. Tämä ongelma on kyettävä muuttamaan laskennalliseen tai koneoppimisen muotoon.

Laske business case, ennen kuin viet projektia eteenpäin. Muista myös, että koneoppimisprojektit ovat ryhmätyötä, jossa tarvitaan ihmisiä monipuolisella taustalla ja tietämyksellä.

Yllä oli yksi esimerkki siitä, miten ei kannata lähteä liikkeelle koneoppimisen saralla. Käsikirjan seuraavassa osassa siirrymme vinkkeihin ja parhaisiin käytäntöihin, joilla koneoppiminen onnistuu!

Kiinnostuitko aiheesta? Lue myös: ”The data journey  how to get moving?”

Kirjoittajasta

Jyrki Martti, Sofigate Senior Advisor, vastaa Sofigaten data-analytiikka-konseptien kehittämisestä Business Technology Design -liiketoiminta-alueella. Jyrki on kiinnostunut erityisesti kehittyneestä data-analytiikasta (data science) ja koneoppimisesta. Erityisesti häntä kiehtoo se, miten yritykset, kunnat ja muut toimijat voisivat kehittää toimintaansa data-analytiikan ja koneoppimisen keinoin.

 

Etsi