Smil! Computerne filmer, genkender og gennemanalyserer dig

Udviklingen indenfor computerkraft, kameraer og data har fået billedgenkendelse til at eksplodere, så det i dag er overalt.

Når kameraer og kunstig intelligens samarbejder er ansigtsgenkendelse et af de mest oplagte brugsscenarier. Billede af <a href="https://www.flickr.com/photos/jurvetson/6866541534">Steve Jurvetson på Flickr</a>

Overalt omkring os findes en usynlig verden, som vi ikke kan se. Den verden består af data, som både vi og vores omverden hele tiden skaber.

Til gengæld kan computerne se den store verden af data. Og de bliver bedre og bedre til det, fordi den teknologiske udvikling gør, at de kan indsamle stadig større mængder data og analysere det ekstremt hurtigt.

Særligt den synlige del af dataverdenen i form af billeder og video af os allesammen er computerne omkring os blevet langt bedre til at se og i sidste ende forstå ved hjælp af kunstig intelligens (AI).

Det kaldes computer vision - computersyn - og det felt har de seneste år gennemgået en enorm udvikling.

AI giver dine apps øjne

Et af de steder, hvor du oftest støder på kunstig intelligens, der arbejder med at genkende billeder, er på din smartphone.

Det sker for eksempel, når Snapchat giver dig skæg og blå briller på, så du kan grine af dig selv og dine venner. Her analyserer appen løbende det, som kameraet peger på for at kunne genkende ansigter.

Vinappen Vivino er et andet eksempel. I stedet for ansigter genkender den vin-etiketter, som du tager billeder af i supermarkedet.

Billedet sendes over nettet til Vivinos system, som analyserer det, og sender information om vinen tilbage til dig, så du er klar til at imponere middagsselskabet med dit indkøb.

Og alle de enorme mængder billeder, vi tager, bliver en del af systemet.

- Vi har igennem otte år modtaget mere end én milliard vin-etiketter, og det vil sige, at vi har et fantastisk materiale til at kunne træne et system, fortæller produktchef i Vivino Theis Søndergaard.

(© Vivino (pressebillede))

Vivino ejer dermed et kæmpe datasæt af billeder, som bruges til at træne algoritmen og i sidste ende gøre appen bedre. Men den kunstige intelligens, der står for at analysere billederne, køber Vivino sig til.

- Vi bruger ikke vores helt egen teknologi. Vi bruger partnere, som er eksperter på de her områder, siger Theis Søndergaard.

Adgang til kunstig intelligens i skyen har gjort det nemt og billigt at bruge billedgenkendelse. Både for mindre virksomheder og for dig og mig.

Og billedgenkendelse har flere anvendelsesmuligheder.

Hjemmelelavede og billige systemer

En af mulighederne er billige eller hjemmelavede systemer, som typisk bruges til overvågning i hjemmet.

Teknologien er nu så let tilgængelig, at DR Viden-journalist Chris Lehmann, der efter eget udsagn er en "komplet amatør" inden for feltet, har været i stand til at bygge et system, som kan genkende ansigterne på redaktionen.

Prisen? Kun omkring 700 kroner.

Og har man ikke lyst til at bygge sit eget kamerasystem, så koster de billige og AI-forstærkede overvågningskameraer i dag helt ned til ca. 150 kroner.

De billige løsninger med en “hyldevare-AI” kan løse simple opgaver. Men der er mange tilfælde, hvor de skrabede løsninger ikke er så oplagte at bruge, og så må man bygge et system fra bunden.

- Det gælder for eksempel, hvis man vil lave billedgenkendelse på noget, som er mere komplekst end en vin-etiket. For eksempel et møbel, fortæller professor i Computer Vision ved Aalborg Universitet, Thomas Moeslund til DR Viden.

Et område, hvor vi har rigtig meget på spil i kunstig intelligens, er i de selvkørende biler, som er under udvikling, men kun i ganske få tilfælde kører på vores veje. Endnu i hvert fald.

Den selvkørende fremtid er baseret på computerspil

Når systemet i de selvkørende biler tager fejl, kan det have fatale følger. Det så vi i marts måned, hvor en bil fra firmaet Uber påkørte en kvinde, som mistede livet.

Men på trods af fejl er udviklingen inden for billedgenkendelse i selvkørende biler gået rigtig stærkt.

En stor del af grunden til det er - måske lidt overraskende - computerspil.

Moderne computerspil kræver nemlig moderne grafikkort for at skabe en så overbevisende spilverden som muligt. Den teknologi, som skaber de overbevisende spilverdener, er også velegnet til AI-udregninger.

Det er den, fordi den kan lave rigtig mange udregninger på samme tid, hvilket en almindelig computer-processor (computerens hjerne) ikke kan.

Seende maskiner i gader og stræder

Kameraer i det offentlige rum er et omdiskuteret emne, fordi de stiller nye spørgsmål om, hvornår overvågningen krænker vores ret til privatliv.

Alligevel er kameraøjne på husmure og lygtepæle et almindeligt syn i dag. Nogle af dem tilhører private virksomheder, mens andre er offentlige.

I Nordjylland er et offentligt projekt i gang, som kombinerer kunstig intelligens med kameraovervågning.

Det er tale om et system, som er udviklet i samarbejde med Aalborg Universitet. Systemet er designet til at forhindre drukneulykker.

Kunstig intelligens registrerer, hvis der er bevægelser ud over kajkanten ved Aalborg Havn ved at holde øje med videoovervågning af havnearealerne.

- Byerne rundt omkring i Danmark åbner havnemiljøerne op, og det betyder, at der er flere, der falder i vandet. Det giver utryghed, fortæller Thomas Moeslund, professor ved Aalborg Universitet og involveret i projektet.

- Så vi tænkte: Hvad med at sætte kameraer op som registrerer, hvis nogen falder i vandet og alarmerer beredskaberne direkte, der så kan rykke ud lynhurtigt.

Ud over at overvåge når ulykker sker, undersøger projektet også, om man kan genkende mønstre, der ofte leder op til ulykker, så alarmen kan gives, allerede inden drukneulykken sker.

Kameraer på samlebånd

Sidst, men ikke mindst, så kan kameraer og billedgenkendelse også findes i industrien. Eksempelvis på fabrikkers samlebånd, hvor man bruger machine vision til at sikre, at elementerne på et samlebånd er helt ens eller til at sortere og putte ting i kasser.

De fabrikker, som producerer alle de varer, vi køber som forbrugere, er selvsagt et kæmpe marked, som af analysefirmaet Stratistics MRC vurderes at vokse fra godt 56 milliarder kroner i 2015 til mere end 94 milliarder i 2022.

Stadig meget vi ikke ved

Men selv om udviklingen inden for computerkraft og datasæt går lynhurtigt, så er der stadig meget, vi ikke ved.

Ifølge Thomas Moeslund skal der ske et gennembrud på algoritme-siden, før den kunstige intelligens eksempelvis kan inddrage konteksten for de svar, den giver, ligesom vi mennesker kan.

Du kan høre mere om AI og billedgenkendelse i denne uges Digitalt på P1, der også har interviews med både Thomas Moeslund og Theis Søndergaard.