3 minutter å lese

Deep Learning + Big Data = Sant!

Det er deep learning som gjør at «alle» igjen snakker om kunstig intelligens og maskinlæring. Det er deep learning som gjør at vi snart vil ha selvkjørende biler på veiene og at mange rutinejobber vi har idag, vil være borte om 10 år. Og det er deep learning som driver utviklingen av mobiltjenester. Les mer: Du har kunstig intelligens i mobilen din

Så hva handler egentlig deep learning om?

Deep learning er en teknikk fra maskinlæring som har vært kjent i flere tiår. Det handler om å trene store og dype nevrale nettverk. Her kan du lese mer om hva nevrale nettverk er.

Klassiske maskinlæring fungerer bra i tilfeller hvor det er enkelt for mennesker å spesifisere problemet som skal løses, for eksempel å lære sammenhengen mellom attributter til blomster (farge, mønster, størrelse, etc) og hvilken art de tilhører.

Nevrale nettverk derimot fungerer bra på problemstillinger som ikke er enkle å spesifisere, for eksempel å skille mellom ulike blomsterarter fra bilder. Ett nevralt nettverk vil lære dette ved hjelp av tusenvis eller millioner av eksempler.

Eksempelet under viser hvordan ulike objekter identifiseres i ett nevralt nettverk. Modellen tar inn en og en pixel og neste lag identifiserer kanter i bildet, neste lag hjørner, osv. Med ett dypt og stort nettverk er man istand til å identifisere komplekse objekter, og feks skille mennesker fra katter.

Deep_Neural_Network
Et dypt nevralt nettverk som lærer seg forskjellen mellom ansikter og katter. Kilde: Google

En annen viktig grunn til at deep learning har stort potensiale er at en og samme modell kan anvendes på ulike problemstillinger. Forskningsgruppen DeepMind i London har blitt verdenskjent for å ha utviklet ett system som kan lære seg å spille dataspill uten instrukser. De har brukt samme system til å lære seg ulike spill, deriblant klassikere som Space Invaders.

nature deepmind
Deepmind fikk forsiden av Nature med sitt gjennombrudd innenfor deep learning. Kilde: nature

Men hvorfor er Big Data så viktig?

Det er i hovedsak to hoveddrivere som gjør at deep learning får stor oppmerksomhet i dag:

  • Store datamengder (Big Data). Kunstig intelligens må trenes for å kunne yte og gi presise svar. Til dette kreves milllioner av eksempler – altså store datamengder.
  • Kraftige prosessorer. Moores lov har vist seg å holde og prosesseringskraften har vokst kraftig. I tillegg har nye kraftfulle prosessorer som er spesielt bra egnet til å utføre parallelle beregninger, vist seg å være viktig for trening av store nevrale nettverk.

Kombinasjonen store datamengder, innovative treningsalgoritmer og prosesseringskraft er altså nøkkelen til gjennombruddet for nevrale nettverk i praktisk bruk. Og det er innenfor nevrale nettverk vi har størst tro på at Big Data virkelig vil komme til sin rett!

I en helt fersk bok om deep learning er det inkludert flere figurer som illustrerer dette på en veldig god måte. De viser hvordan datamengder, prosesseringskraft  og størrelse på nevrale nettverk har økt eksponensielt de siste 50 årene. Først rundt 2010 begynte deep learning modellene å gi fornuftige resultater. Men fra 2010 til 2015 har feilraten i bildegjenkjenning blitt redusert fra 30% til under 5%!

Dette betyr at nevrale nettverk og deep learning har nådd et punkt der de på noen områder er bedre enn mennesker til å forstå sanseinntrykk som synsinntrykk og lyd. Og det er derfor vi nærmer oss selvkjørende biler veldig snart!