„Google“ pristatė naujus „Nano Banana“ ir „Gemini“ modelius vaizdams ir vaizdo įrašams generuoti
„Google“ paskelbė apie dviejų naujų dirbtinio intelekto modelių, skirtų medijos turiniui kurti, išleidimą. Nano Banana 2 Lite tapo greičiausiu ir pigiausiu Gemini Image šeimos modeliu vaizdams generuoti. Tuo tarpu Gemini Omni Flash skirtas vaizdo įrašų kūrimui ir redagavimui naudojant tekstines komandas.
Nano Banana 2 Lite pasižymi dideliu veikimo greičiu ir maža kaina. Pasak „Google“, modelis sugeneruoja vieną vaizdą maždaug per 4 sekundes, o generavimo kaina siekia 0,034 JAV dolerio už tūkstantį vaizdų, todėl tai yra prieinamiausias modelis visoje linijoje.

Kūrėjai teigia, kad modelis tiksliai laikosi naudotojo užklausų, nuosekliai atvaizduoja tuos pačius personažus ir geba taisyklingai generuoti tekstą pačiuose vaizduose. Bendrovė rekomenduoja rinktis jį vietoje ankstesnio Nano Banana modelio, nes naujoji versija užtikrina aukštesnę kokybę ir mažesnes sąnaudas.
Savo ruožtu Gemini Omni Flash skirtas darbui su vaizdo įrašais. Modelis geba kurti vaizdo įrašus pagal tekstinius aprašymus, taip pat juos redaguoti dialogo režimu, suprasdamas natūralią naudotojo kalbą.
Jis vienu metu palaiko darbą su tekstu, vaizdais ir vaizdo įrašais, todėl, pavyzdžiui, galima įkelti paveikslėlį ir paversti jį trumpa animuota scena. Šiuo metu maksimali vaizdo įrašo trukmė yra 10 sekundžių, o generavimo kaina siekia 0,10 JAV dolerio už vieną vaizdo įrašo sekundę.

„Google“ siūlo abu modelius naudoti kartu. Pavyzdžiui, Nano Banana 2 Lite greitai sugeneruoja vaizdą, o Gemini Omni Flash jį paverčia vaizdo įrašu.
Be to, naudojant Interactions API, galima išsaugoti sesijos kontekstą ir atlikti iki trijų nuoseklių redagavimų, palaipsniui tobulinant rezultatą, nepradedant darbo iš naujo.
„Google“ pabrėžia, kad abu modeliai naudoja SynthID technologiją, skirtą nepastebimam sugeneruoto turinio skaitmeniniam žymėjimui. Tokios žymos buvimą galima patikrinti naudojant Gemini programėlę, Chrome naršyklę ir Google paieškos sistemą.
Bendrovės darbuotojų teigimu, tai turėtų padidinti generatyvinio dirbtinio intelekto naudojimo skaidrumą ir palengvinti medžiagos, kuri buvo sukurta arba pakeista dirbtiniu intelektu, atpažinimą.
