Dumme data og troll til leverandører

«Data er dumme» proklamerte Gartner for en tid siden, og fortsatte: «Verdien ligger i hva man gjør med dataene». Ved første øyekast logisk. I andre runde meningsløst og misvisende.

Data er en råvare. Råvarer har verdi, men ingen intelligens. Om det kvalifiserer til karakteristikken ‘dum’ er imidlertid tvilsomt. Er olje, kull, korn, stein og vann dumme?

Vi er tilbake på Gartners ITXPO i Barcelona i desember 2015, som betimelig diskuterte data, verdi, algoritmer og muligheter. Det bidrar imidlertid ikke til markedets forståelse å insinuere at algoritmer avgjør om data har verdi eller ikke. På den ene siden finnes det enorme mengder verdiløse data – som burde vært kastet og som ingen algoritme i verden kan pine verdier ut av. På den andre siden finnes det data – også store mengder, om ikke like mye – med reell verdi og som KAN verdiøkes via en kombinasjon av dataspesialister og algoritmer.

Det er ikke tilfeldig at Data Science rangeres som en profesjon med formidable fremtidsutsikter (se Sikkert karrierevalg: Bli Data Scientist). Poenget som ofte undertrykkes er at data uten kontekst har beskjeden verdi uavhengig av algoritmer, eller motsatt: Kontekst er verdiøknings-element nummer én – og et bidrag som inntil videre kommer fra mennesker. Spesialister som forstår sammenheng, opprinnelse, ser muligheter, stiller spørsmål og som ikke minst forstår verktøyene og kan utvikle/raffinere algoritmene.

Forståelse har vært og er fortsatt den største utfordringen i data-sfæren – som (fortsatt) ofte kalles Big Data. Mangelfull forståelse på flere nivåer har gitt feil forventninger, magre resultater og skuffelser. Ivrige leverandører og optimistiske (noen vil si naive) kunder har trodd at verktøy + data = resultater, mens den riktige ligningen er verktøy + kvalifiserte data + spesialister = resultater.

Hvis den nye varianten av Big Data – råvarer for AI/ML/DL – skal bli god business for andre enn leverandørene, handler det mindre om å samle og mer om å filtrere og kaste mest mulig data.

Maskinlæring og Big Data Analytics handler definitivt om de beste algoritmene, men i enda større grad om de beste hodene – som kan stille riktige spørsmål. For å stille riktige spørsmål, kreves forståelse – av dataene, verktøyene, virksomheten, behovene og settingen. Uansett hva leverandørene sier – Big Data Analytics og effektiv ML kan ikke kjøpes ferdig pakket – ‘in a box’ eller 'as a Service'. I årene fremover skal det svært spesielle argumenter til for å kjøpe spesial-hardware for Big Data uansett setting. Infrastrukturen finnes og kan leies – rimelig. Verktøyene likeså.

Og sist, men ikke minst: Data er ikke dumme. De er enten kastbare eller verdifulle. Spesialistene vet forskjellen.

Legg igjen kommentar

Dette nettstedet bruker Akismet for å redusere spam. Lær om hvordan dine kommentar-data prosesseres.