Inspiration

Teknologi med talegaver

Stemmen bliver i højere og højere grad en brugerflade, man tager med i sine overvejelser. Faktum er, at næsten alt teknologi har potentiale til at kunne styres med stemmen. Men hvornår kommer dagen, hvor vi kan tale med vores maskiner, som om de var mennesker?

At stemmen er en brugerflade i fremgang, er helt tydeligt, og vores hverdag vil snart blive præget af mere eller mindre intelligent teknologi. Vi kommer til at omgive os med produkter, der lærer af vores talemønster og formes af det. Den kan tilgodese vores ønsker ved at koble sig op på andre enheder og udveksle information. Giampiero Salvi, universitetslektor på KTH’s Department for Speech, Music and Hearing har længe arbejdet inden for området.

– De fleste store spillere som Google, Apple, og Microsoft, har satset stort på stemmeteknologi. Nu begynder teknologien at fungere tilstrækkelig godt til, at de kan udbyde tjenester.

Han ser to årsager til, at teknologien nu er moden til at tage til det brede forbrugermarked. Dels er en relativt gammel teknologi, kunstige neurale netværk, blevet udviklet og forbedret. Tidligere var der en begrænsning i og med, at indlæringsmetoderne ikke har været effektive nok til at kunne træne stemmeteknologien på tilstrækkeligt store datamængder.

– Det, der er sket nu, er, at det er blevet relativt billigt at indsamle data og bearbejde dem. Man har indsamlet flere og flere data – især på de sprog, der tales af mange.

En brugerflade vi allerede kan

Det andet, der er sket, er, at de store virksomheder får meget information retur om brugerne; hvilke kontakter de har, hvilke vaner, hvordan deres stemme lyder og anden værdifuld information.

– Systemerne får meget mere kontekst nu, og det betyder, at vi oplever en hurtig forbedring.

Giampiero Salvi ser mange fordele ved teknologien, den største er måske, at brugerne ikke behøver lære sig, hvordan systemerne fungere for at kunne bruge dem.

– Man er allerede vant til brugerfladen, så længe systemet fungerer på en tilstrækkelig naturlig måde.

Desuden behøver man ikke bruge hænderne, så du kan styre andre ting samtidig - for eksempel når du sidder i bilen eller i andre situationer, hvor du bruger hænderne. Teknologien er også en stor fordel for folk med handicap.

Men det er en udfordring, at vi mennesker bruger sproget på en masse forskellige og meget fleksible måder.

Naturlig konversation er svær

– De nuværende systemer fungerer fint, så længe du begrænser emnet, du taler om som for eksempel bookninger eller styring af apparater. At tale frit er ikke lige så uproblematisk.

Amazon har stillet en udfordring for forskere og universiteter i at skabe et dialogsystem, hvor en konversation flyder naturligt i 20 minutter. Indtil videre er ingen lykkedes med det. Selv har Amazon fået meget opmærksomhed for Alexa, den virtuelle assistent der primært er koblet til højtaleren Echo, og som kan hjælpe med mange forskellige opgaver i hverdagen.

– De store virksomheder er de mest innovative, for de har mange ressourcer. De har formodentlig bedre forskningsmuligheder, end vi har i den akademiske verden.

”Technology Vision 2017”, en trendrapport fra virksomheden Accenture, fastslår, at skærmene vil være væk på de fleste applikationer om syv år og være erstattet med en form for stemmestyring. Giampiero Salvi, som har fulgt udviklingen længe, er lidt mere tilbageholdende.

– Stemmestyringsteknologien findes allerede i dag, det er bare et spørgsmål om markedsføring. Men hvis du vil have en helt naturlig interaktion uden begrænsninger, så er syv år meget kort tid.

Områder hvor stemmeteknologien vil blive brugt

Smarte hjem

Et af de mest naturlige steder, hvor stemmestyring vil komme til at spille en rolle, er for eksempel at styre omgivelserne med hensyn til lys, lyd og temperatur.

Handel

En stresset forbrugers drøm kan for eksempel være, at man fortæller sin assistent, hvad der skal købes ind, og den så finder det sted, hvor indholdet i kurven bliver billigst.

Hverdagssupport

Google lancerede for nylig Duplex, som er en tjeneste, der kan ringe og booke frisørbesøg eller bord på en restaurant. Personen i den anden ende vil sandsynligvis aldrig opdage, at det ikke er et menneske, der ringer op.

Inden for ældrepleje

Mennesker, der har vanskeligt ved teknologi eller er fysisk begrænsede, kan ved hjælp af tale også benytte sig af kunstige assistenter.

Se flere IT-trends her

13 august 2018

Tags