Luk

Kontroverskortlægning: ADD-forskernes kollektive eksperiment

Der eksisterer en del kontroverser om algoritmer. Men kan vi også se hvordan kontroverserne ser ud? Og hvilke mønstre er der i disse?

Af Torben Elgaard Jensen, leder af AAUs bidrag til ADD forskningsprojektet.

ADD projektets forskere beskæftiger sig med en række store spørgsmål: Hvornår og hvordan er algoritmer og AI kommet på agendaen? Hvilke former for kontroverser opstår der omkring algoritmer og AI? Hvordan bidrager forskellige typer af medier til at skabe vores forestillinger, forhåbning og bekymringer om algoritmer og AI?

En central del af ADD-forskningsprojektet handler om at kortlægge kontroverser om algoritmer. Kontroverser kan fx være diskussioner om bias, manglende menneskelig kontrol eller overvågning. I ADD-projektet arbejder et team fra AAUs teknoantropologiske laboratorium (TANTlab) på at undersøge, hvordan algoritmer kontroverser udspiller sig i forskellige medier. Vores strategi er at indsamle store datamængder fra nyhedsmedier, sociale medier og videnskabelige medier, som vi bruger til at udvikle vidensgrundlag og forskningsredskaber, som hele forskningsgruppen kan bruge aktivt i deres respektive forskningsfelter.

I det seneste halve år har TANTlab arbejdet med to store datasæt. Det ene datasæt består af alle de 34.000 nyhedsartikler i perioden 2010-2020, der nævner algoritmer, kunstig intelligens, AI eller maskinlæring.  Materialet er hentet fra samtlige danske medier og er doneret af InfoMedia, som er en af ADD projektets samarbejdspartnere. Det andet datasæt belyser hvordan algoritmer, AI og maskinlæring omtales i den videnskabelige litteratur. Dette datasæt består af over 1 mio. abstracts hentet fra den videnskabelige artikel database Scopus. Vi har produceret visualiseringer af de to datasæt, vi har identificeret mønstre (semantiske temaer), og vi har udviklet et søge- og visualiseringsværktøj, som har gjort det muligt for vore kolleger i ADD projektet at udforske specifikke algoritme-relaterede emner og diskussioner. Det hele er blevet testet på en tre-dages workshop, en såkaldt datasprint, hvor ADD forskere fra RUC og AU arbejdede intensivt med udforske, hvordan algoritme problematikker fra deres forskningsfelter afspejlede sig i de to store datasæt.

Baggrunden for kontroverskortlægning: fra etnografiske casestudier til digitale metoder

De mangfoldige debatter, forhåbning og bekymringer om algoritmer er af relativ ny dato. Men ambitionen om at kortlægge teknologi-kontroverser er ikke ny. Mange af ADD projektets forskere er inspireret af feltet Science and Technology Studies (STS), hvor man har studeret kontroverser om videnskab og teknologier siden 1970’erne. Kontroverser kan defineres som situationer hvor parter er uenige, ikke kan ignorere hinanden og er enige om at de er uenige. STS-forskere har foretaget casestudier af mange typer af kontroverser, heriblandt rivalisering mellem videnskabelige laboratorier, magtkampe mellem konkurrerende teknologier, utilsigtede konsekvenser af infrastrukturer, og teknologibrugeres forsøg på at ’hacke’ standardprodukter. Samtidig har STS-forskere udviklet begreber og etnografiske metoder, som gør det muligt at følge de centrale aktører i kontroverser og spore kontroversernes udvikling over tid. Casestudier spiller stadig en stor rolle i STS, men fra 00’erne begyndte STS forskere også at orientere sig mod de muligheder, som lå i udviklingen af internettet. STS-forskere etablerede fælles projekter med softwaredesignere, datavisualiseringseksperter og medieforskere for at undersøge mulighederne for at indsamle store datamængder på nettet og for at bruge nye computationelle muligheder for at finde mønstre i, hvordan kontroverser udfolder sig online. De resulterende studier tog stadig udgangspunkt i cases eller bestemte temaer, men i takt med de udvidede datamuligheder bredte der sig også en appetit på at følge mange aktører, større kontroverser og længere tidsforløb.

I dag er kontroverskortlægning en del af metodearsenalet i STS, og metoderne er i hastig udvikling. Der kommer hele tiden nye muligheder for at indhøste store datamængder og nye muligheder for visualisere data og foretage computer-assisterende analyser.

Den kortlægning af kontroverser vedr. algoritmer, AI og maskinlæring, som ADD projektet har arbejdet med i dette forår bygger videre på de erfaringer, som TANTlab og labbets internationale samarbejdspartnere har gjort i de seneste år.

Vi har eksperimenteret med en række metoder til semantisk analyse og valgt en fremgangsmåde, som giver optimalt overblik over store tekstmængder. Det er denne form for analyse, som ligger til grund vores visualiseringen af InfoMedia og Scopus datasættene.

Vi har lært, at kortlægninger bliver mest værdifulde, når folk med substantiel viden om konkrete felter kan hjælpe med at formulere de skarpe spørgsmål. Derfor havde vi inviteret vore kolleger i ADD projektet til at hjælpe os med at udforske materialet.

Vi har lært, at dynamiske kort virker væsentligt bedre end statiske. Derfor har vi ikke blot produceret datavisualiseringer i plakat-størrelse. Vi har også udviklet et interface, som gør det muligt for forskere at søge på bestemte ord, hvorefter de relevante dele af kortet lyste op. Samtidig giver interfacet mulighed for at få vist det konkrete materiale, som ’ligger under’ udvalgte dele af kortet.

Sidst men ikke mindst har vi lært, at kontroverskort kan bruges og fortolkes på mange forskellige måder. Derfor havde vi skitseret en række mulige analysestrategier, som vi præsenterede for vore kolleger i ADD projektet. Inspireret at disse strategier, lærte de hurtigt udforske, hvordan bestemte kontroversielle temaer udfoldede sig over tid, de lærte at zoome frem og tilbage mellem overordnede mønstre og konkrete kvalitative detaljer, og de brugte interfacet til at lede efter begivenheder og aktører, som kunne gøres til genstand for opfølgende casestudier.  

TANTlab’s såkaldte datascape – et interface som giver mulighed for at lokalisere udvalgte tematikker på det overordnede kort og fremsøge artikler, som knytter sig til den valgte problematik.

Hvordan ser algoritme-kontroverserne ud?

Som nævnt giver TANTlab’s interface mulighed for at dykke ned i mange detaljer og undersøge, hvordan algoritmer bliver diskuteret i relation til andre temaer, fx etik, beslutningsstøtte eller innovation. De overordnede kort kan derfor med god ret betragtes som startpunkter snarere end som endelige resultater.

Ser man imidlertid på de overordnede kort i sig selv, tegner der sig nogle konturer af, hvordan nyhedsmedier og videnskabelige medier har behandlet algoritmer og de beslægtede termer maskinlæring og AI.

For nyhedsmediernes vedkommende bliver algoritmer ofte nævnt ifbm. tech-nyheder eller business nyheder, typisk med fokus på fremskridt og muligheder. Algoritmer bliver mere kritisk omtalt i artikler som handler om dansk politik, EU, Kina eller USA. Derudover bliver algoritmer og AI omtalt i en betydelig mængde artikler om kunst, kultur og underholdning. Dette felt er således en yderligere arena, hvor der reflekteres over, hvad algoritmer betyder for vores samfund.

Kortet som er baseret på videnskabelige abstracts fra Scopus databasen viser en række forskellige fagfelter, som hver især arbejder med specifikke algoritmer. Cirka halvdelen af disse felter er defineret af medicinske specialer, fx onkologi, genetik og ortopædkirurgi. Blandt de øvrige felter kan nævnes klassiske fagområder som fysik, kosmologi og matematik, og en række mere anvendte felter såsom klimamodeller, signal processering, energisystemer og social datascience. Endelig er der subfelter, som (formentligt) fungerer som underleverandører af teknologier til andre felter. Det drejer sig om computervision og remote sensing. Det generelle indtryk af Scopus kortet er, at interessen for algoritmer er stærkt specialiseret og i vid udstrækning følger en række fagdiscipliner.

De overordnede konturer af de to kort er som sagt kun en del af billedet. De forskellige partnere i ADD projektet er allerede i gang med at undersøge, hvordan de overordnede kort kan kaste lys på ADD projektets forskellige tematiske områder: privatliv & cybersecurity, offentlig forvaltning, sundshedsdata, finance og innovation. I den forstand er kontroverskortlægningen et kollektivt projekt, som ADD forskerne løbende vil arbejde videre på. Vi begynder at kunne visualisere og se kontroverserne, men fra mange forskellige vinkler.