Nettprat-prosjektet: Bruk av nettprat-bevis innhentet i etterforskning som treningsdata til en lærende KI-modell

Sunde, Inger Marie; Bendiksen, Jørgen; Sunde, Nina

Sunde, Inger Marie; Bendiksen, Jørgen; Sunde, Nina

Report

Published version

Åpne

nettprat.pdf (1.090Mb)

Permanent lenke

https://hdl.handle.net/11250/3023474

Utgivelsesdato

2022

Metadata

Vis full innførsel

Samlinger

Rapporter - PHS forskning [82]

Sammendrag

Prosjektet ble gjennomført i et samarbeid mellom Politihøgskolen og Trøndelag politidistrikt. Formålet var å undersøke om data i straffesaker om seksuelle overgrep mot barn var egnet som treningsdata for å utvikle et forebyggende verktøy basert på maskinlæring (kunstig intelligens). Verktøyet hadde i så fall behov for data i nettprat mellom overgriper og fornærmede (barnet), som finnes i straffesakene. Prosjektet har avdekket flere problemer som står i veien for å realisere dette formålet.

Størstedelen av data innsamlet i slike straffesaker krever mye behandling for å gjøres maskinlesbare i et konsistent format med tanke på innmating i en lærende algoritme. Ressursbruken ved å gjøre dette må følgelig veies mot verdien av annen innsats som kan gjøres uten bruk av verktøyet.

Forskjellig praksis mellom politidistriktene i håndteringen av data sikret som bevis gjør at datatilfanget varierer mellom distriktene, både med hensyn til fullstendighet og kvalitet. Dette svekker kvaliteten til det totale datatilfanget med tanke på bruk som treningsdata for en lærende algoritme.

Datatilfanget i straffesaker er utvilsomt en verdifull ressurs som kan utnyttes for å utvikle innovative verktøy som kan hjelpe politiet i å forebygge alvorlige seksuelle overgrep mot barn. Imidlertid tar verken datasystemene eller den praktiske bruken av dem, hensyn til behov som må ivaretas for å kunne utnytte dataene som ressurs i forebyggende arbeid. For å kunne ha et egnet datagrunnlag til forebyggingsformålet må politiet tenke nytt om behandlingen av slike data. Kravene som stilles til ‘high-risk’ KI-systemer og til treningsdataene kvalitet i den foreslåtte europeiske forordningen om kunstig intelligens bør være veiledende.

Utgiver

Politihøgskolen

Serie

PHS Forskning;2022: 5