Kanų festivalyje buvo parodytas 95 minučių filmas, sukurtas per dvi savaites naudojant DI
Tobulėjant vaizdo generavimo pagal tekstinę užklausą paslaugoms, kino industrijoje pradėjo rastis studijos, kurios specializuojasi tiek serialų, tiek pilnametražių filmų kūrime, nepasitelkdamos aktorių ir nenaudodamos dekoracijų. Vienas tokių DI pagalba sukurtų filmų šiemet net dalyvavo Kanų kino festivalyje.
Jo kūrėjas yra startuolis Higgsfield, įkurtas San Franciske prieš trejus metus, kuris iki šiol specializavosi serialų kūrime, kurių vienos serijos trukmė siekia apie 22 minutes. Pilnametražį filmą „Ilgas kelias į pragarą“ (Hell Grind), trunkantį 95 minutes, startuolis sukūrė per dvi savaites, tam išleidęs 500 000 dolerių. Iš šios sumos 400 000 dolerių buvo skirta prieigai prie skaičiavimo pajėgumų apmokėti. Higgsfield pateikė paraišką dalyvauti žinomame kino festivalyje tam, kad pademonstruotų galimybes, kurias industrijai suteikia generatyvinis DI.
Kanų renginio dalyviai pastebi, kad, lyginant su ankstesniais metais, požiūris į pačią filmų kūrimo naudojant DI idėją pradeda keistis — nuo baimės dėl amato sunaikinimo pereinama prie atsargaus neišvengiamos tokių technologijų plėtros priėmimo. Festivalio atidarymui skirtoje spaudos konferencijoje aktorė Demi Moore pareiškė, kad aktoriai turi ieškoti galimybių dirbti su technologijomis: „DI jau čia. O kovoti su juo reiškia pradėti mūšį, kuriame pralaimėsime.“
Higgsfield režisierius ir prodiuseris Adilet Abish mano, kad DI suteikia galimybę papasakoti pasauliui savo istoriją. Pasak DI filmo kūrėjų, darbui su naujais įrankiais vis tiek reikalingi klasikinės kino gamybos įgūdžiai — pavyzdžiui, scenos kompozicijos taisyklių išmanymas. Gegužę įmonė pasiekė 400 mln. dolerių metinių pajamų tempą. Ji remiasi viešai prieinamais DI modeliais vaizdo kūrimui, tokiais kaip Google Veo 3 ir Seedance 2.0, kurį sukūrė ByteDance. Pats startuolis tik prideda savo know-how, leidžiantį užtikrinti DI generuojamų scenų ir vaizdų nuoseklumą.
Vienu tekstinės užklausos pateikimu galima gauti 15 sekundžių sugeneruoto vaizdo įrašą. Kiekviena tokios trukmės scena visada generuojama kelis kartus, šiek tiek patikslinant užklausą, kad būtų galima pasirinkti geriausią „dublį“. Kalbant apie pilnametražį filmą, pirmosioms 25 minutėms prireikė sugeneruoti 16 181 penkiolikos sekundžių trukmės klipą, iš kurių buvo atrinkti 253 galutiniai variantai. Tekstinės užklausos turi būti labai detalios, atsižvelgiančios į vizualizacijos stilių, apšvietimą, tam tikros filmavimo įrangos imitaciją bei vaizdo efektus. Ypatingą dėmesį teko skirti apšvietimui scenose, nes DI dažniausiai nepasižymi realistiškumu galutiniuose vaizdo įrašuose ir „peršviečia“ scenos turinį. Apskritai, kadre judantys aktoriai ir objektai turi atitikti fizikos dėsnius, ir tam taip pat reikia specialių komentarų pradinėse tekstinėse užklausose. Iš esmės kiekviena užklausa vidutiniškai sudaro apie 3000 žodžių.
Startuolis pasirengęs uždirbti iš tokios specifikos išmanymo kuriant filmus ir serialus naudojant DI. Klientai siunčia Higgsfield savo scenarijus, o startuolis grąžina jiems detalias tekstines užklausas kiekvienam scenarijaus puslapiui. Kadangi iki galutinio montažo išlieka tik nedidelė dalis DI sugeneruotų vaizdo klipų, darbo su debesų kompiuterijos resursais išlaidos yra labai didelės. Konkrečiai, pilnametražis filmas Kanų kino festivaliui pareikalavo 400 000 dolerių išlaidų debesų paslaugų tiekėjams apmokėti. Ir jei Higgsfield nebūtų bendradarbiavusi šioje srityje su vadinamaisiais neocloud sektoriaus atstovais, išlaidos galėjo būti dar didesnės. Kaip aiškina startuolio atstovai, negalima tiesiog prisijungti prie pokalbių roboto ir paprašyti: „Sukurk man gerą 95 minučių filmą.“
