Alibaba pristatė dirbtinio intelekto modelį „Qwen VLo“, sugebantį redaguoti paveikslėlius
Alibaba pristatė naujos kartos dirbtinį intelektą, kuris žymiai palengvins vartotojams vaizdų kūrimą ir redagavimą, remiantis tekstais ir vizualine medžiaga. Modelis, pavadintas „Qwen VLo“, taps dalimi „Qwen“ prekės ženklo dirbtinio intelekto paslaugų serijos ir leis ne tik generuoti vaizdus pagal tekstinius užklausimus, bet ir modifikuoti jau esamus.
Leidinys „Bloomberg“ praneša, kad naujasis modelis ne tik analizuoja duomenis, bet ir pagal juos sugeba generuoti aukštos kokybės vaizdus. Pavyzdžiui, vartotojas gali įvesti tekstinę užklausą, o po generavimo paprašyti pridėti tam tikrų detalių, pavyzdžiui, kepurę katinui. Taip pat galima įkelti jau paruoštą vaizdą ir jį „papildyti“.
Viena iš pagrindinių „Qwen VLo“ savybių yra progresyvaus generavimo technologija, leidžianti vartotojui stebėti vaizdo kūrimo procesą žingsnis po žingsnio. Pavyzdžiui, galima pateikti užklausą „Sukurk mielo katino paveikslėlį“, ir sistema pradės formuoti vaizdą tiesiog vartotojo akyse.
Savo tinklaraštyje bendrovė taip pat pažymėjo, kad naujoji modelio versija ne tik „suvokia aplinką“, bet ir sugeba kurti aukštos kokybės rekonstrukcijas, remdamasi šiuo suvokimu. Tai atitinka anksčiau bendrovės generalinio direktoriaus Eddie Wu pareiškimus, kad pagrindinis „Alibaba“ tikslas šiuo metu yra stipraus dirbtinio intelekto (AGI), turinčio žmogaus raidos lygį, kūrimas.
„Qwen VLo“ modelis pozicionuojamas kaip konkurencingas atsakymas kitiems rinkos sprendimams, įskaitant „OpenAI“ produktus. Tačiau „Alibaba“ taip pat susiduria su aršia konkurencija Kinijos viduje, pavyzdžiui, su „DeepSeek“, kuri sukėlė furorą šioje srityje, pareiškusi, kad sukūrė galingą modelį už kelis milijonus dolerių. Atsakydama į tai, „Alibaba“ dar aktyviau pradėjo diegti naujas funkcijas tekstų, vaizdų, garso ir vaizdo įrašų apdorojimui, taip pat optimizuodama modelį darbui su išmaniaisiais telefonais.