„DeepSeek“ išleido patobulintą R1 dirbtinio intelekto modelį su 685 milijardais parametrų

Kinijos startuolis „DeepSeek“ išleido atnaujintą dirbtinio intelekto modelio R1 versiją su 685 milijardais parametrų, kurią paskelbė „Hugging Face“ platformoje su atvira MIT licencija. Bendrovės pranešime „WeChat“ teigiama, kad modelis buvo nežymiai atnaujintas ir gali būti laisvai naudojamas komerciniuose projektuose.

„Hugging Face“ saugykloje kol kas nėra išsamaus modelio aprašymo, tik konfigūraciniai failai ir „svoriai“ (angl. weights) – skaitmeniniai parametrai, lemiantys modelio veikimą ir galimybes. Atnaujinta R1 turi 685 milijardus parametrų, todėl, kaip pažymi „TechCrunch“, be papildomos optimizacijos ją vargu ar įmanoma paleisti įprastuose vartotojų kompiuteriuose dėl didelių resursų poreikių.

Primename, kad „DeepSeek“ projektas šių metų pradžioje sulaukė didelio dėmesio po pirmosios R1 versijos išleidimo, kuri tapo konkurentu „OpenAI“ modeliams. Tačiau startuolio sėkmė sukėlė susirūpinimą kai kuriems JAV reguliuotojams, kurie mano, kad bendrovės technologijos gali kelti potencialią grėsmę nacionaliniam saugumui.

Nepaisant to, „DeepSeek“ tęsia savo dirbtinio intelekto platformos plėtrą. Atvira MIT licencija leidžia kūrėjams ir verslui laisvai testuoti bei diegti R1 savo produktuose, nors modelio veikimui reikalingos didelės skaičiavimo galios.