Hva er Data Science, og hva betyr det for meg og min bedrift? 

Data Science, Big Data, kunstig intelligens, maskinlæring. Alle temaer som har vært mye omtalt på konferanser og i bedrifter, som ønsker å ta en ledende rolle i markedet innenfor sitt felt. Men hva er det egentlig? 
Data science har i mange settinger blitt brukt som nærmest et buzz-word blant norske bedrifter. Ryktene er mange. Alt fra roboter som overtar jobbene våre, til presentasjoner som omhandler relativt enkle løsninger på dagens problem.  Sannheten ligger nok nærmere sistnevnte. Data science kombinerer statistikk, analyse og maskinlæring. I tillegg trenger man god fagkunnskap for å forstå, analysere og utnytte faktiske fenomener. Det kan være alt fra forståelse av kunders handlinger til nøye monitorering av maskiner i produksjon. Dette for å kunne fange opp feil raskere med en hensiktsmessig bruk av menneskelige ressurser. 


Objektivitet 

Data science har flere fordeler, der kanskje den fremste av alle er den objektive sannhet. Mange bedrifter tror kanskje at de kjenner kunden bedre enn konkurrentene. Men hvordan kan det da ha seg at 50% av kundene da bare interagerer med bedriften en gang i året? Eller at det bare er 3% av kundene som har vært i kontakt med bedriftens ansatte, enten i form av salgspersonell, kundeservice, eller en spørreundersøkelse. Hvordan kan man da danne seg et objektivt inntrykk av hele markedet? Resultatet er, i de fleste tilfeller, at man benytter erfaring fra alle disse kundemøtene, føyer til litt man har lært fra kundeundersøkelser, men i stor grad overdriver den enkeltes personlige erfaringer. Med en riktig og god bruk av data science kan man ofte hente ut hva som er den faktiske sannhet.  


Optimalisering

Det er ikke bare salgspersonale som kan ha mye å hente fra data science. Industri og produksjon har kanskje de største gevinstene å hente ut. Med maskinlæring finnes det mange metoder for å optimalisere produksjonen. For eksempel hvilken blanding av metaller som gir størst styrke og holdbarhet kan være vanskelig, dyrt, og tidkrevende og finnes svar på. Ved hjelp av modellering og predikasjon kan man både estimere den best mulige blandingen for styrke og holdbarhet, samt regne ut hvilken kombinasjon som er den mest kostnadseffektive med tanke på produksjonen. I utgangspunktet noe som økonomer og ingeniører allerede utfører i stor grad. Men da i svært tidkrevende prosjekter, og som ofte ender opp i heftige diskusjoner der økonomen ofte er den som må overtales til hva som er riktig med tanke på egne oppfatninger og verdier. Særlig i disse tilfellene kan en gjennomtenkt algoritme og utregning være et viktig hjelpemiddel. Der kan man se det faktiske resultatet både på bunnlinje og på kvalitet, uten å ha kastet bort viktige ressurser på å produsere dårlige prototyper. 


Automatisering

Industrien har også mye å hente på automatisering. Det er kanskje her de fleste tenker roboter som utfører relativt enkle oppgaver. Men maskinlæring handler først og fremst om at man kan ta raske beslutninger basert på input. Et eksempel er vibrasjoner på en motor. I et tilfelle kan noe så enkelt som unormale vibrasjoner på en motor være et tydelig tegn på at motoren burde hatt service. I mange tilfeller er det snakk om at de samme endringene kunne vært oppdaget som en ulyd på motoren. Men det kan være både kritisk og kostbart å vente på den tiden det tar før noen oppdager ulyden i motoren. I disse tilfellene kan automatisering og maskinlæring spare bedriften for flere titalls tusen kroner. Særlig når det ofte er snakk om relativt dyre motorer og maskiner, der nedetid også kan være avgjørende for bedriftens renommé og bunnlinje.

 
Effektivisering

Et siste eksempel er effektivisering. Under OL i Pyeongchang ble det tatt over 3100 dopingprøver. Med en gjennomsnittlig kostnad på ca. 3500 kroner utgjør det en totalkostnad på over 10 millioner kroner. Til tross for såpass store investeringer var det kun 4 utøvere som ble tatt for doping. Til tross for det, estimerer forskere at mellom 40-50% av utøverne dopet seg, i en anonym undersøkelse utført i forbindelse med de pan-arabiske leker, og VM i friidrett i 2013. Ikke usannsynlig ville en god analyse kunne effektivisert bruken av disse anti-dopingmidlene betraktelig. La for eksempel parametere som øvelse, resultat, alder, kjønn, nasjonalitet og historiske resultater bli tatt med i betraktning for hvem som skal testes, og når testene skulle utføres. Det er da ikke usannsynlig at det ville vært flere som ble tatt. Tilsvarende metoder vil man også kunne benytte på salg. I dag er mye av en-til-en-markedsføring styrt av følelse og erfaring. Med enkle input som alder, kjønn, bosted, utdanning og potensielt også inntekt og fritidsinteresse, ville man kanskje kunne effektivisert salg av både bil og hus i langt større grad sammenlignet med dagens metoder som ofte kan være sterkt påvirket av hvem man solgte til sist for 3 dager siden. Ofte får man høre om hva som "alltid funker" når man kommer i prat med selgere. Sannheten er nok heller at det fungerer fordi man alltid bruker den samme metoden eller trikset, eller fordi man alltid henvender seg til samme type kunder. Salgene man aldri hører om er de selgeren ikke fikk, hvor kunden kjøpte et nesten identisk hus med omtrent samme beliggenhet, av en annen selger. Data science kan i stor grad bidra til å hindre dette ved hjelp av objektive data, testing og kombinasjonen av statistikk, analyse og fagkompetanse.   

 

Skrevet av: Vegard Ølstad Dalberg


Med en riktig og god bruk av data science kan man i de fleste tilfeller hente ut hva som er den faktiske sannhet.