Čínští výzkumníci představili nový AI model Vidu, který umí převádět text na video. Nástroj přichází jen dva měsíce po úspěchu konkurenčního modelu Sora.

Čínská technologická firma ShengShu-AI a univerzita Tsinghua představily Vidu – model umělé inteligence pro převod textu na video. Jako první v Číně se prý vyrovná nástroji Sora od americké společnosti OpenAI.
Vidu dokáže jedním kliknutím vytvořit 16sekundový videoklip v rozlišení 1080p. Je postaven na vlastní vyvinuté architektuře modelu vizuální transformace nazvané Universal Vision Transformer (U-ViT) integrující dva modely AI pro převod textu na video Diffusion a Transformer.
Vidu dokáže simulovat skutečný fyzický svět a generovat scény se složitými detaily v souladu s reálnými fyzikálními zákony, jako jsou přiměřené efekty světla a stínu a jemné výrazy obličeje.
Vidu navíc skvěle rozumí i čínským specifikům a podle zpráv médií dokáže generovat obrazy jedinečných čínských znaků, jako jsou panda a loong.
Čínský model AI pro převod textu na video přišel jen asi dva měsíce poté, co svět s nadšením přijal americký model Sora.
"Po vydání modelu Sora jsme zjistili, že úzce souvisí s naším technickým plánem, což nás dále motivovalo k tomu, abychom odhodlaně pokročili v našem výzkumu," uvedl Zhu Jun, proděkan Ústavu umělé inteligence na univerzitě Tsinghua a hlavní vědecký pracovník společnosti ShengShu-AI.
Základní technologii U-ViT poprvé navrhl výzkumný tým Vidu v září 2022, tedy ještě dříve, než vznikla modelová architektura DiT – Diversity in Transformation společnosti Sora.
Jak rychlý internet můžete mít u vás doma? Vyplňte formulář níže a hned to zjistíte!
Zadejte ulici, číslo popisné, obec a použijte našeptávač.
Máte na mysli nějakou z následujících adres?
Chci s ověřením dostupnosti pomoci od operátora.
Zanechte nám platný kontakt a operátor Vás bude kontaktovat.

11. 5. 2024
Autor: Redakce DSL.cz
Generativní umělá inteligence se rychle prosazuje v reklamním průmyslu. Firmy ji využívají k rychlejší a levnější...
Slavia pojišťovna řeší rozsáhlý únik citlivých dat, ke kterému došlo kvůli chybě na straně dodavatele. Mezi uniklými...
Interní studie společnosti Meta zjistila, že rodičovský dohled ani nástroje rodičovské kontroly výrazně neomezují...
ByteDance uvedl nový AI model Seedance 2.0 pro generování videí. Na čínských sítích se stal virálním a někteří ho...
Čeští mobilní operátoři reagují na aktuální situaci na Blízkém východě a aktivují zákazníkům v regionu bezplatná...
V lednu rychlost Wi-Fi internetu vzrostla. Podívejte se, jak skončil váš poskytovatel a u kterého z nich jsme...