Ny studie: ChatGPT er dårligst til å kreditere

Roger Aarli-Grøndalen
nyhetsstudio

KI-modeller er generelt dårlige til å kreditere nyhetskilder – og ChatGPT kommer dårligst ut. Det viser en ny studie fra McGill University, omtalt av Nieman Lab.

Forskerne testet modellene ChatGPT, Claude, Gemini og Grok på over 2200 canadiske nyhetssaker. Resultatet viser at modellene ofte gjengir sentrale deler av journalistikken, men uten å oppgi hvor informasjonen kommer fra.

I hele 92 prosent av svarene manglet kildehenvisning.

ChatGPT peker seg ut som den svakeste aktøren. Modellen oppga kilder i kun 1 prosent av svarene når brukeren ikke eksplisitt ba om det, samtidig som den gjenga særpreget innhold i over halvparten av tilfellene.

Også de øvrige modellene scorer lavt. Gemini krediterte kilder i 6 prosent av svarene, Grok i 7 prosent, mens Claude gjorde det noe bedre med 16 prosent.

Felles for modellene er at de blir betydelig flinkere dersom brukeren aktivt ber om kilder.

Powered by Labrador CMS