KI-frykt gjør at aviser stenger Internet Archive ute

Roger Aarli-Grøndalen
nyhetsstudio

Flere store nyhetsmedier strammer nå inn Internet Archives tilgang til sine nettsider, av bekymring for at arkivtjenesten kan brukes som en omvei for KI-selskaper som samler treningsdata. Det kommer fram i en gjennomgang gjort av Nieman Lab.

Internet Archive er en ideell stiftelse som har som formål å bevare nettets historikk, blant annet gjennom Wayback Machine, et åpent arkiv som lar brukere se tidligere versjoner av nettsider.

The Guardian har valgt å stenge Internet Archives API-tilgang og filtrere bort artikler fra Wayback Machine, etter at avisen så at arkivet var en hyppig crawler i tilgangsloggene.

– Mange av disse KI-selskapene er på jakt etter lett tilgjengelige, strukturerte databaser med innhold. Internet Archives API ville vært et åpenbart sted å koble seg på og suge ut immaterielle rettigheter, sier Robert Hahn, leder for forretnings- og lisenssaker i The Guardian, til Nieman Lab.

Også New York Times bekrefter at de nå blokkerer Internet Archives roboter.

– Vi tror på verdien av New York Times’ menneskestyrte journalistikk og vil alltid sikre at våre immaterielle rettigheter brukes og aksesseres på lovlig vis. Vi blokkerer Internet Archives bot fordi Wayback Machine gir ubegrenset tilgang til NYTs innhold – også for KI-selskaper – uten tillatelse, sier en talsperson for avisen.

Internet Archive-gründer Brewster Kahle advarer mot konsekvensene av utviklingen.

– Hvis utgivere begrenser biblioteker, som Internet Archive, vil offentligheten få mindre tilgang til den historiske dokumentasjonen, sier Kahle.

Powered by Labrador CMS