OpenAI atskleidė tikrąją ChatGPT pataikūniško elgesio priežastį

Po to, kai buvo atšauktas paskutinis GPT-4o atnaujinimas dėl pernelyg didelio modelio pataikavimo vartotojams, „OpenAI“ pradėjo aiškintis tokio neįprasto ir atgrasą dirbtinio intelekto (DI) elgesio priežastį. Kūrėjai nustatė, kad GPT-4o pradėjo teikti pirmenybę vartotojų vertinimams, pažeisdama pagrindines modelio elgesio taisykles.

Vartotojai pastebėjo problemą dar prieš atšaukiant atnaujinimą ir pradėjo dalintis ekrano kopijomis socialiniuose tinkluose. Konkrečiai, ChatGPT ėmė sutikti net su absurdiškais ar potencialiai pavojingais teiginiais. Kaip rašo „The Verge“, pavyzdžiu tapo žurnalo „Rolling Stone“ tyrimas, kuriame aprašomi atvejai, kai kai kurie žmonės teigė, jog „ChatGPT pažadino dvasinį sąmoningumą, palaikantį jų religinius įsitikinimus, susijusius su didybės manija“.

„OpenAI“ generalinis direktorius Samas Altmanas (Sam Altman) pareiškė, kad viena pagrindinių problemos priežasčių buvo „patinka“ ir „nepatinka“ mygtukų naudojimas kaip papildomas signalas mokant modelį. Pasak Altmano, tai galėjo susilpninti pagrindinio mechanizmo, anksčiau padėjusio kontroliuoti pataikavimo apraiškas, įtaką. „Mes nesitikėjome, kad vartotojai gali teikti pirmenybę malonesniems, bet mažiau teisingiems atsakymams“, – pažymėjo bendrovė. Taip pat buvo nurodyta, kad funkcija, leidžianti prisiminti ankstesnį bendravimą su DI, galėjo sustiprinti pataikavimo efektą.

Kita reikšminga atnaujinimo nesėkmės priežastis, kurią nurodė „OpenAI“, buvo testavimo trūkumai. Nors neprisijungus atlikti vertinimai ir A/B testai rodė gerus rezultatus, kai kurie ekspertai pastebėjo, kad DI pradėjo elgtis keistai. Nepaisant to, kūrėjai vis tiek išleido atnaujinimą, nesureikšmindami šių signalų.

„OpenAI“ pažadėjo informuoti vartotojus apie visus ChatGPT veikimo pokyčius, net jei jie atrodo nežymūs. Tai turėtų padėti išvengti situacijos pasikartojimo, kai DI pradeda pernelyg aktyviai pataikauti pašnekovui, ignoruodamas logiką ir sveiką protą.