Negalima pasitikėti dirbtinio intelekto asistentais – pusėje atsakymų yra rimtų klaidų, parodė tyrimas
Remiantis nauju Europos transliuotojų sąjungos (EBU) ir BBC tyrimu galia teigti, kad pagrindiniai dirbtinio intelekto asistentai beveik pusėje savo atsakymų iškraipo naujienų turinį, praneša „Reuters“. Maždaug 45 % analizuotų DI asistentų atsakymų turėjo bent vieną reikšmingą klaidą, o 81 % atsakymų turėjo tam tikrų problemų, parodė tyrimas.
Tyrime dalyvavo 22 valstybinės žiniasklaidos organizacijos iš 18 šalių, įskaitant Prancūziją, Vokietiją, Ispaniją, Jungtinę Karalystę ir JAV. EBU ir BBC specialistai analizavo 3000 atsakymų į naujienų klausimus, pateiktus pagrindinių dirbtinio intelekto asistentų, įskaitant „ChatGPT“, „Copilot“, „Gemini“ ir „Perplexity“, 14 kalbų. Atsakymai buvo vertinami pagal tikslumą, informacijos šaltinio paiešką ir gebėjimą atskirti nuomonę nuo faktų.
Apie haliucinacijų problemą, kai dirbtinio intelekto modelis generuoja neteisingą ar klaidinančią informaciją, dažnai dėl tokių veiksnių kaip duomenų trūkumas, anksčiau buvo pranešusios „OpenAI“ ir „Microsoft“. Šios bendrovės pažymėjo, kad dirba siekdamos išspręsti šią problemą.
Savo ruožtu „Perplexity AI“ teigia, kad vienas iš jų režimų „Gilusis tyrimas“ pasiekia 93,9 % tikslumą, vertinant pagal atitikimą faktams.
Tyrimo duomenimis, trečdalyje dirbtinio intelekto asistentų atsakymų buvo rimtų klaidų, susijusių su duomenų šaltiniais, pvz. šaltinio nebuvimas, klaidinanti ar neteisinga atribucija. Maždaug 72 % „Gemini“, „Google“ dirbtinio intelekto asistento, atsakymų turėjo rimtų problemų dėl duomenų šaltinių, tuo tarpu konkurentų šis rodiklis buvo mažesnis nei 25 %. Apie 20 % atsakymų buvo pastebėtos tikslumo problemos, įskaitant pasenusios informacijos pateikimą.
Remiantis 2025 m. „Reuters Institute“ skaitmeninių naujienų ataskaita teigiama, kad apie 7 % visų internetinių naujienų vartotojų ir 15 % jaunesnių nei 25 metų amžiaus žmonių naudoja dirbtinio intelekto asistentus naujienoms gauti. Kadangi dirbtinio intelekto asistentai vis dažniau naudojami vietoj tradicinių naujienų paieškos sistemų, visuomenės pasitikėjimas jais gali būti susilpnintas, teigė Europos transliuotojų sąjunga. Dėl šios priežasties tyrėjai paragino dirbtinio intelekto srities bendroves gerinti savo asistentų darbo su naujienų užklausomis kokybę.