Dirbtinis intelektas užplūdo internetą: 35 % pastaraisiais metais atsiradusių svetainių sukurta neuroninių tinklų
Tyrėjų grupė, kurioje dalyvauja Stanford University darbuotojai, Imperial College London mokslininkai ir projekto Internet Archive entuziastai, paskelbė išvadas straipsnyje „Dirbtinio intelekto sugeneruoto teksto poveikis internetui“. Jų duomenimis, nuo 2022 metų daugiau nei trečdalis visų svetainių buvo sukurta naudojant DI. Tyrimas taip pat parodė, kad DI generuojamas turinys daro internetą pozityvesnį, bet mažiau įvairų.
Įkvėpti „mirusio interneto“ teorijos — idėjos, kad didžiąją dalį interneto dabar sudaro tarpusavyje bendraujantys botai — tyrėjai kreipėsi į Internet Archive, kad gautų svetainių pavyzdžius per 33 mėnesius nuo 2022 m. rugpjūčio iki 2025 m. gegužės. Ši ne pelno organizacija saugo skaitmeninį interneto turinį ateities kartoms.
„Kiekvienam pasirinktai URL adresui gauname seniausią prieinamą archyvinę kopiją per CDX Wayback Machine API, — rašoma tyrime. — Kiekvienos kopijos pradinis HTML kodas atsisiunčiamas ir saugomas lokaliai tolesniam apdorojimui.“ Tyrėjai naudojo DI aptikimo programinę įrangą Pangram v3, kuri, jų teigimu, yra tiksliausia priemonė nustatyti neuroninių tinklų sukurtą turinį.
„Nerimą kelia DI sugeneruoto ir apdoroto teksto plitimas internete, kuris gali lemti semantinės ir stilistinės įvairovės mažėjimą, faktinio tikslumo problemas ir kitus neigiamus padarinius, — teigia tyrėjai. — Nustatėme, kad iki 2025 m. vidurio apie 35 % naujai paskelbtų svetainių buvo priskirtos prie sukurtų ar apdorotų DI, palyginti su nuliniu rodikliu iki ChatGPT paleidimo 2022 m. pabaigoje.“

„Man neįtikėtinas greitis, kuriuo dirbtinis intelektas užvaldo internetą, — sakė Jonáš Doležal, DI tyrėjas iš Stanfordo ir vienas straipsnio autorių. — Po dešimtmečių, kai internetą formavo žmonės, per vos trejus metus didelė jo dalis tapo nulemta dirbtinio intelekto. Mano nuomone, stebime milžinišką skaitmeninės erdvės transformaciją per daug trumpesnį laiką, nei prireikė ją sukurti.“
Tyrėjai patikrino šešias dažniausiai keliamas kritikas DI generuojamam tekstui:
- Ar tai siaurina nuomonių įvairovę?
- Ar didėja dezinformacija dėl „haliucinacijų“?
- Ar tekstas internete tampa „sterilesnis“ ir pozityvesnis?
- Ar tampa sunkiau nurodyti šaltinius?
- Ar kuriami mažos semantinės vertės tekstai?
- Ar tai veda prie vienodumo ir „monokultūros“?
„Kiekvienai hipotezei nustatėme išmatuojamą rodiklį, apskaičiavome jį kiekvienam mėnesiniam svetainių rinkiniui ir tikrinome koreliaciją su bendru DI tikimybės rodikliu“, — paaiškino mokslininkai. Pavyzdžiui, tikrindami dezinformaciją, jie ištraukė faktinius teiginius iš svetainių ir vertino jų teisingumą. Šaltinių naudojimui vertinti skaičiavo nuorodų tankį DI generuotame tekste.
Tyrėjų nuostabai, pasitvirtino tik dvi iš šešių hipotezių. DI daro internetą mažiau semantiškai įvairų ir apskritai pozityvesnį, tačiau neskatina melagingos informacijos plitimo ir nepanaikina šaltinių.
„Labiausiai nustebino tai, kad mūsų hipotezė apie tiesos nykimą nepasitvirtino, — pažymėjo Doležal. — Sąmoningai ieškojome akivaizdžiai klaidingų teiginių augimo, bet to neradome. Vis dėlto gali būti, kad DI nepastebimai didina teiginių, kurių negalima patikrinti esamais įrankiais, kiekį. Arba pats internetas niekada nebuvo itin linkęs laikytis tiesos.“
Tyrėjai teigė tęsiantys DI turinio poveikio internetui analizę. Šiuo metu jie kuria „nuolatinį įrankį“, kuris leis stebėti situaciją realiu laiku, o ne fiksuoti vienkartinius „momentinius vaizdus“. Taip pat planuojama nustatyti, kurių tipų svetainėse DI turinys dominuoja labiausiai — pagal kategorijas ir kalbas — bei įvertinti, kur jo poveikis ryškiausias.
Pasak Doležalo, tokie tyrimai yra kritiškai svarbūs siekiant išlaikyti internetą naudingą ir produktyvų. „Didėjant DI generuojamo turinio kiekiui, svarbiausia rasti būdą, kaip šias sistemas naudoti taip, kad jos nekurtų tik išvalyto ir pasikartojančio turinio. Vietoj to verta suteikti joms daugiau individualumo ar net prieštaringumo — tai leistų joms tapti kūrybiniu partneriu, o ne žmogaus balso pakaitalu.“
