Čínští výzkumníci představili nový AI model Vidu, který umí převádět text na video. Nástroj přichází jen dva měsíce po úspěchu konkurenčního modelu Sora.

Čínská technologická firma ShengShu-AI a univerzita Tsinghua představily Vidu – model umělé inteligence pro převod textu na video. Jako první v Číně se prý vyrovná nástroji Sora od americké společnosti OpenAI.
Vidu dokáže jedním kliknutím vytvořit 16sekundový videoklip v rozlišení 1080p. Je postaven na vlastní vyvinuté architektuře modelu vizuální transformace nazvané Universal Vision Transformer (U-ViT) integrující dva modely AI pro převod textu na video Diffusion a Transformer.
Vidu dokáže simulovat skutečný fyzický svět a generovat scény se složitými detaily v souladu s reálnými fyzikálními zákony, jako jsou přiměřené efekty světla a stínu a jemné výrazy obličeje.
Vidu navíc skvěle rozumí i čínským specifikům a podle zpráv médií dokáže generovat obrazy jedinečných čínských znaků, jako jsou panda a loong.
Čínský model AI pro převod textu na video přišel jen asi dva měsíce poté, co svět s nadšením přijal americký model Sora.
"Po vydání modelu Sora jsme zjistili, že úzce souvisí s naším technickým plánem, což nás dále motivovalo k tomu, abychom odhodlaně pokročili v našem výzkumu," uvedl Zhu Jun, proděkan Ústavu umělé inteligence na univerzitě Tsinghua a hlavní vědecký pracovník společnosti ShengShu-AI.
Základní technologii U-ViT poprvé navrhl výzkumný tým Vidu v září 2022, tedy ještě dříve, než vznikla modelová architektura DiT – Diversity in Transformation společnosti Sora.
Jak rychlý internet můžete mít u vás doma? Vyplňte formulář níže a hned to zjistíte!
Zadejte ulici, číslo popisné, obec a použijte našeptávač.
Máte na mysli nějakou z následujících adres?
Chci s ověřením dostupnosti pomoci od operátora.
Zanechte nám platný kontakt a operátor Vás bude kontaktovat.

11. 5. 2024
Autor: Redakce DSL.cz
X zavedla štítky se zemí původu účtů v rámci větší transparentnosti. Odborníci i bývalí zaměstnanci ale varují, že...
OpenAI odhaduje, že do roku 2030 bude za předplatné ChatGPT platit asi 8,5 % z 2,6 miliardy uživatelů, tedy zhruba...
Čínské technologické skupiny přesouvají trénování AI modelů do jihovýchodní Asie, aby měly přístup k čipům Nvidia i...
Vánoční kampaně českých operátorů přinášejí zvýhodněné telefony, tarify i příslušenství. Zákazníci mohou získat...
Vodafone upraví ceny starších paušálních tarifů řad Red Basic a Neomezený. Zdražení začne platit 4. prosince 2025 a...
T-Mobile spustil vánoční nabídku slev na telefony, tablety i další zařízení až 8 000 Kč. Nechybí adventní kalendář...