Inspiration

Computer vision – en hjørnesten inden for artificial intelligence

Selvkørende biler, VR, ansigtsgenkendelse og autonome industrirobotter er nogle af de allervarmeste teknologiområder lige nu. Og de har alle én ting til fælles - computer vision. Men at få en maskine til at kende forskel på en plastikpose og en bold er vanskeligere, end man umiddelbart skulle tro.

Computer vision er et forskningsområde, der ikke har tiltrukket sig så meget opmærksomhed, men som ligger til grund for meget af det, vi ser lige nu som den absolut hotteste fremtidsteknologi. At lære en maskine at forstå visuel information er en central del inden for artificial intelligence, autonome køretøjer, robotter og meget andet.

Allerede i dag benyttes computer vision inden for så forskellige områder som sundhedsvæsenet og retssystemet. Via ansigtsgenkendelse kan systemet selv se, om en bestemt person findes på en overvågningsvideo. På den måde slipper en medarbejder for at skulle sidde og kigge en stor mængde videomateriale igennem manuelt. På samme måde kan røntgenbilleder analyseres automatisk for at gennemføre en første screening på jagt efter for eksempel kræfttumorer.

– Man kan forestille sig et sundhedsvæsen på nettet, hvor en bestemt form for foranalyse automatiseres, og hvor kun de tilfælde, som computeren vurderer, behøver en nærmere undersøgelse, sendes til en menneskelig læge, siger Michael Felsberg, som er professor i computer vision på Linköpings universitet.

Udfordring at tolke billeder

Men noget af det, vi mennesker tager for givet, er meget kompliceret for en maskine. At tolke sine omgivelser er ikke i første omgang et spørgsmål om at kunne se, men snarere om at kunne forstå, hvad du ser.

– Et billede er bare en stor matrix. Det indeholder ingen konkrete oplysninger om objekt eller afstand. Det eneste et kamera måler er intensiteten i lyset. Al tolkning sker i softwaren, siger sker Michael Felsberg.

En af udfordringerne for computer vision handler om ren processorkraft. I de selvkørende biler, vi har i dag, er der for eksempel kamera, GPS, radar, laser og en masse andre kilder til information. Alt dette skal tages ind, fortolkes og behandles af computeren for, at bilen skal kunne træffe en beslutning om at køre.

Men den største udfordring ligger i metodologien. Det, der er enkelt for et menneske; at få en spontan opfattelse af verden bare ved at kigge på den, er utrolig kompliceret for en computer.

– Computere er gode til at se, om et billede hænger lige, men at skelne mellem en plastikpose og en bold er vanskeligt for computer vision. Vi forsøger at afkode en del af den menneskelige intelligens, som er meget fundamental men utroligt svær at måle. Det gør det meget svært at bygge modeller for, hvordan computere skal tolke, hvad den ser, siger Michael Felsberg.

Selvlærende systemer

I stedet for at prøve at forudse alle mulige situationer en selvkørende bil kan havne i, har forskerne de seneste år i stedet ændret fokus i retning af machine learning. Det betyder, at de oplærer et kunstigt system, snarere end programmerer det. Men det medfører andre problemer.

– I selvlærende systemer er der to udfordringer. Dels at vide hvorfor noget virker eller ikke virker, og dels at få et mål for hvor sandsynligt det er, at en tolkning er korrekt, siger Michael Felsberg.

Hvornår vil computer vision nå til et niveau, hvor vi reelt har selvkørende biler i en større kommerciel skala? Michael Felsberg synes, det er sværere end nogensinde tidligere at forudsige, men han svarer på spørgsmålet ved at fortælle om, hvilke anbefalinger han har givet sine børn med hensyn til at tage kørekort.

– Min datter, som er 18 år, har allerede kørekort, og min 16-årige søn anbefaler jeg også at tage et. Men min 12-årige søn vil sikkert ikke få brug for det, siger han.

Se flere IT-trends her

21 august 2018

Tags