4 minutter å lese

Nå kan også blinde «se» Facebook-bilder – takket være AI

De første sporene av at blinde mennesker har fått hjelp av hunder, finner vi i et veggmaleri fra rundt år 100 i den romerske byen Herculaneum. Men det var først rundt år 1780 at den første systematiske bruken av førerhunder ble observert i Paris.

Nå kan tiden være inne for den neste store omveltningen i hvordan blinde og svaksynte kan få hjelp. Ikke av spesialtrente dyr, men av datamaskiner – eller, rettere sagt: kunstig intelligens.

For tiden kjemper nemlig verdens største teknologiselskaper en knallhard kamp om hvem som kan bli best på kunstig intelligens (også kjent som AI), som raskt kan bli et av våre aller største teknologiske fremskritt (eller krumspring?).

Uansett hvilket av selskapene som vinner «kappløpet», vil blinde og svaksynte kunne komme seirende ut av det hele, i form av nye programmer, tjenester og dingser.

Disse skal ikke bare kunne hjelpe dem med å bevege seg uhindret og trygt rundt i verden, men også kunne hjelpe dem til å kunne «se» mye av det folk med bra syn tar for gitt av innhold på internett.

Blant selskapene som i det siste virkelig har satt inn støtet for åpne digitale dører for blinde, er Facebook. Selskapet ønsker nå å bruke sin gryende teknologi innen kunstig intelligens til å tolke hva som befinner seg på de over to milliarder bildene som hver dag lastes opp via selskapets tjenester Facebook, Instagram, Messenger og WhatsApp.

Slik at disse igjen kan beskrives, via opplest tale, til brukerne som ellers ikke får se dem.

Som en av damene i videoen over sier:

– Jeg tror det er sant som det sies at et bilde kan være mer verdt enn tusen ord. Men det krever at noen beskriver det for deg. Bare det å få tre stikkord er nok til å hente frem alle detaljene jeg ellers ikke kan se, er nok til at jeg føler meg inkludert, at jeg er en del av det hele.

Funksjonen, som Facebook selv kaller «automatisert alternativ tekst», er foreløpig bare tilgjengelig for iOS-brukere som har aktivert skjermlesing. Mens disse tidligere bare har fått høre navnet på personen som har delt et bilde, etterfulgt av den temmelig generiske termen «foto», kan de nå få en liste over ting som figurerer på bildene som dukker opp i feeden.

Dette er mulig takket være Facebooks teknologi for gjenkjenning av objekter på bilder, basert på et nevralt nettverk som har milliarder av parametre, og millioner av tidligere eksempler den kan dra lærdom av.

Les også: Facebook kjenner deg igjen – selv uten å se fjeset ditt

Slik fungerer det hele i praksis:

Selv skrev Facebook-gründer Mark Zuckerberg, som beviselig er svært opptatt av AI også på hjemmebane, følgende på nettopp Facebook da utviklingen av den nye bildefunksjonen ble kjent:

– Vi ser på AI som noe som kan hjelpe datamaskiner med å forstå verden – slik at de kan være bedre hjelpemidler for folk. Vi er fortsatt tidlig i utviklingen av denne teknologien, så du kan allerede begynne å forestille deg hvor hjelpsom den vil kunne være i fremtiden.

Ifølge tall fra Verdens helseorganisasjon er det mange som kan sette pris på en slik fremtid – på verdensbasis anslås det å være 39 millioner blinde og 246 millioner svaksynte. Sjansen er stor for at mange av disse skulle ønske at de kunne bruke internett i større grad, men også bedre kunne navigere seg rundt i sine analoge omgivelser.

Med slike tall kommer det neppe som en overraskelse at også andre teknologikjemper enn Facebook jobber med å bedre situasjonen for blinde og svaksynte.

På sin Build-konfereranse tidligere i vår kunne Microsoft fortelle at også de har tatt i bruk kunstig intelligens for å gjøre verden til et bedre sted for de som ikke kan se. Med sitt «Seeing AI»-prosjekt vil de la blinde få se hva som skjer foran dem, som beskrevet av en datamaskin.

– En av de tingene jeg alltid har drømt om, helt siden jeg gikk på universitetet, var ideen om at noe kunne fortelle deg, når som helst, hva som foregår rundt deg, sa Microsoft-utvikler Saqib Shaikh på en video som ble vist på konferansen.

Shaikh har spilt en nøkkelrolle under utviklingen av Seeing AI, og har kanskje et bedre grunnlag for dette enn mange andre ettersom han har vært blind siden sjuårsalderen.

Kort fortalt kan Microsofts nye AI-app gjøre det mulig for blinde å oppleve nettopp det Shaikh har drømt om: Å få beskrevet hva som skjer rundt dem, i sanntid. Det hele er basert på Microsofts «Intelligence API», som vi tidligere har fått prøve med mer eller mindre hell i tjenesten How-Old.net.

Det er lett å si seg enig med Shaikh i det han uttaler:

– For noen år siden var dette science fiction. Jeg hadde aldri trodd at det var noe du faktisk kunne gjøre. Men kunstig intelligens utvikler seg stadig raskere, og jeg er veldig spent på å se hvor teknologien kan føre oss.

Noen andre som også lurer på det samme, er forskerne i Toyota. De har på sin side jobbet lenge med det de kaller «Project BLAID», en slags krage som ved hjelp av kunstig intelligens kan analysere omgivelsene og formidle disse til bæreren, enten i form av tale eller vibrasjoner.