AI finder hurtigt personfølsomme oplysninger i aktindsigter

Af Anton Pallisgaard-Olesen, [email protected]

Projektet AI Aktindsigt kan finde personfølsomme oplysninger, der skal sløres, og er derfor tidsbesparende for medarbejdere. Sprogmodellerne bliver open source i november.

27. OKT 2023 8.45

Administration

Læs også

AI-løsning er en succes: Reducerer tid til mailsortering med 66 pct.

Når en kommune får en anmodning om aktindsigt, kan det tage rigtig lang tid at sløre personfølsomme oplysninger. Det kan projekt AI Aktindsigt hjælp med, da den er trænet i at opfange personfølsomme oplysninger, så de kan blive streget over. Projektet er tværkommunalt mellem Sønderborg, Fredensborg og Vejen samt leverandøren Aktio.

Sprogmodellerne, som AI'en er bygget på, bliver open source og det forventes, at det allerede sker i november, hvor det bliver tilgængeligt på sprogteknologi.dk. Det vil betyde, at leverandører og kommuner gratis vil kunne få adgang til sprogmodellerne og derefter bygge dem ind i deres egne løsninger.

Sprogmodeller er en anden type AI end fx ChatGPT, som er en generativ AI, der ud fra en tekst kan generere nyt indhold. En sprogmodel kan læse og forstå en tekst og derefter fremsøge den information, man beder modellen om at lede efter. Det er på den måde, at AI'en kan finde frem til fx alle navne, der skal sløres, i en over tusind sider lang aktindsigt.

Jesper Schmidt, der er projektleder i Sønderborg Kommune, ser meget positivt på, hvad de har opnået med projektet.

- Der er noget tidsbesparende i det her. Selvfølgelig skal du stadigvæk ind og lige kontrollere, men AI'en er god til at finde de nødvendige oplysninger i en kompliceret tekst med fx en masse navne, og det er både på dansk og fremmedsprog, siger han.

Når AI Aktindsigt skal kigge igennem en række dokumenter, er den i stand til hurtigt at finde og markere relevante oplysninger. Det kan fx være navne, cpr-numre, personfølsomme oplysninger eller information om en anden person, end den aktindsigten handler om. På den måde er det en hjælp til medarbejdere, der skal kigge igennem en stor mængde dokumenter, da AI'en allerede har markeret mange af de vigtige oplysninger.

- Jeg har hørt, at det nogle gange kommer op på 1.300 sider, og det er mange sider at gennemgå. Med AI'en ligger det hele digitalt, og de bliver understøttet af AI'en i at finde der, hvor der relevante oplysninger, som de skal tage stilling til, siger projektkoordinator Katarina Stengaard.

Dataindsamling og GDPR er tidskrævende

En AI skal bruge en masse data, den kan lære af. I dette tilfælde en hel masse dokumenter, hvor den trænes i at finde de oplysninger, som man vil have den til at finde. Det er noget, der tager rigtig lang tid.

- Først skulle vi finde ud af, hvad sagsbehandlerne ser og laver. Så skulle vi have en masse data, så vi kunne træne vores grundmodel, som vi kalder det. Efterfølgende har medarbejdere lavet annoteringer på, hvad der fx er navne og cpr-numre, så AI'en kunne lære. Derefter skulle den fintunes, så modellen kunne blive bedre og bedre, siger Jesper Schmidt.

Især dataindsamlingen har været tidskrævende, men det har GDPR også været. Katarina Stengaard synes ikke nødvendigvis, at GDPR har været en udfordring, men det har taget meget lang tid.

- Jeg har været med til at lave en stor del af vores konsekvensanalyse, og det har taget tid. Det har været en prioritet for os at sikre, at det her lever op til de GDPR-krav, der er i forbindelse med sådan et projekt. Det er nogle heftige data, som de her sprogmodeller skal behandle, siger hun.

Projektet er en del af digitaliseringsstyrelsens såkaldte signaturprojekter og har fået støtte på 5,3 mio. kr.

Tekst, grafik, billeder, lyd og andet indhold på dette website er beskyttet efter lov om ophavsret. DK Medier forbeholder sig alle rettigheder til indholdet, herunder retten til at udnytte indholdet med henblik på tekst- og datamining, jf. ophavsretslovens § 11 b og DSM-direktivets artikel 4.

Kunder med IP-aftale/Storkundeaftaler må kun dele DK AIs artikler internt til brug for behandling af konkrete sager. Ved deling af konkrete sager forstås journalisering, arkivering eller lignende.

Kunder med personligt abonnement/login må ikke dele DK AIs artikler med personer, der ikke selv har et personligt abonnement på DK AI

Afvigelse af ovenstående kræver skriftlig tilsagn fra det pågældende medie.