Nylig skrev medieforsker Tellef Raabe i sin Aftenposten-spalte at kunstig
intelligens kan undergrave medienes forretningsmodell. Han pekte blant annet på at de såkalte språkmodellene kan gjenskape innhold bak betalingsmur, selv om de er instruert til å la være.
Samtidig jobber
Aftenposten med å rulle ut et KI-verktøy for journalister som skraper andre
nettsider.
Men kan webappen til Aftenposten gi journalistene tilgang
til innhold bak betalingsmur?
– Den kan egentlig ikke det, sier Aftenposten-journalist
og KI-guru Per Kristian Bjørkeng.
Gode tilbakemeldinger
Bjørkeng, som også har skrevet boka «Knekk ChatGPT-koden», har utviklet flere KI-verktøy, men den nye webappen
Aftenposten kaller Nyhetsjegeren er den største og mest omfattende. Han
sier til Journalisten at det etter et strategimøte i kulturavdelingen
kom frem at det hadde vært nyttig å ha et verktøy for å bøte på
informasjonsoverbelastning for journalistene.
– Man klarer liksom ikke å være godt nok
orientert, for det er så utrolig mange forskjellige kilder.
Nyhetsjeger-appen er foreløpig ikke tilgjengelig for alle
journalister i Aftenposten, men håpet er å få den rullet ut til hele
redaksjonen, forteller Bjørkeng.
Til nå har noen journalister testet den, og
tilbakemeldingene har vært gode.
Bekymret
Men kunstig intelligens som skraper nettsider møtes ikke bare
med applaus blant alle medier. Balansen mellom eierskap til eget innhold og research-verktøy
har blant annet gitt utslag i at New
York Times har saksøkt OpenAI – selskapet bak ChatGTP – for å gi tilgang til informasjon bak betalingsmur.
Klassekampen dekket også nylig temaet med chatboter som har
fått tilgang bak betalingsmurer, der Tellef Raabe sier han er veldig bekymret,
og der utviklingsredaktør i Dagens Næringsliv, Magnus Aabech, langt på vei deler den
bekymringen.
For ber man Chat GPT oppsummere artikler bak betalingsmur,
vil den i flere tilfeller gjøre nettopp det, påpeker Klassekampen.
Respekterer regler
I Aftenposten har de konkludert med at de holder seg på
riktig side, sier Bjørkeng, men legger til at de ikke ønsker å gjøre
noe de ikke bør gjøre.
Ifølge Bjørkeng fungerer løsningen slik: Et API (grensesnitt som gjør at programvare kan utveksle informasjon), levert av
selskapet Spider, skraper et nettsted. Deretter får brukeren et sammendrag i en
rangert feed, generert av ChatGPT.
– Spider skal respekterer robots.txt, og vi har ikke fått
noen indikasjon på at dette ikke skjer, sier Bjørkeng.
Robots.txt er enkelt forklart nettstedets beskjed til API-er
om hva som ikke skal skrapes.
– Hvis VG sier at deres innhold ikke skal skrapes, for eksempel, så skal det
ikke gjøres. Foreløpig har vi valgt å stole på Spider. Uansett leverer vi ikke
skrapet tekst videre til brukeren. Den viktigste hindringen mot å gå inn bak
betalingsmur er nå at dersom appen mottar noe fra Spider, vil den bare gi
brukeren et lite sammendrag på et par setninger, pluss tittel og lenke. Det er
litt som Google, sier Bjørkeng.
Avhengig av betaling
Dersom brukeren klikker på en lenke som leder til en
artikkel som krever abonnement, må journalisten fortsatt betale for full tilgang.
– Selv om Spider skulle gitt appen hele artikkelen, får brukeren bare ut det
korte sammendraget. Derfor har vi tenkt at dette er noe vi kan gjøre.
Ikke minst fordi de fleste nettsteder ønsker at journalister
følger med, sier Bjørkeng, som legger til at verktøyet også brukes til å
overvåke statlige nettsider, regjeringen og kommuner.
– Men vi er selv avhengig av at publikum betaler for
innhold, og ønsker ikke å gjøre noe vi ikke har tillatelse til.
Når det gjelder tilgangen til artikler som krever abonnement,
mener Bjørkeng at ulike tekniske løsninger der teksten først vises og deretter skjules av et grått felt, kan gjøre innholdet tilgjengelig for
skraping.
– Hvis en avis har den typen betalingsløsning, og samtidig
ikke har reservert seg mot skraping via robots.txt, så tror jeg at Spider leser
det. Mange nettsteder reserverer seg ikke mot skraping. De vil vil jo at Google skal skrape hos dem, slik at
innholdet blir kjent.
Det hele er en balansegang, sier Bjørkeng, som understreker
at dersom verktøyet i visse tilfeller skulle få tilgang på en hel artikkel bak
betalingsmur, vil den ikke gis videre til brukeren.
– Man eier ikke fakta
Håpet er å rulle ut løsningen til flere journalister i
Aftenposten, men det vil ta tid, ifølge Bjørkeng. Han er alene om å utvikle
appen, samtidig som han jobber som journalist.
Slik det fungerer nå, kan brukeren for eksempel gi appen
instruksjoner om en høy «oi-faktor», og dermed kun få de aller viktigste
oppdateringene i sin feed, forteller Bjørkeng.
– Det er spennende. Det er sprøtt at en journalist som ikke
kan kode, kan skrape masse nettsteder og få oversikt. Jeg opplever at det har
vært ganske nyttig.
– Men hvis de aller viktigste poengene er tatt fra en sak
bak betalingsmur, er ikke det litt stjeling uansett?
– Grunnleggende tenker jeg at man eier teksten og bildene, men ikke fakta. Man
eier ikke det som har skjedd. Vi har allerede muligheten til å skrive
sitatsaker, men så må man være nøye som journalist med å finne riktig balanse.
Opphavsretten er ikke der for å stenge fakta inne.
Når appen skal rulles ut, er uvisst, og det er også en
betydelig kostnad knyttet til prosjektet, forteller Bjørkeng.
– Det er derfor vi prøver å lage det selv. Og så er det et spørsmål om hvor mye
kostnader det blir per bruker. Det
kommer vi til å finne ut av, avslutter han.