Disneyov model AI generuje animované sekvencie zo scenárov

Disneyov model AI generuje animované sekvencie zo scenárov

Realisticky povedané, skutočnosť, že AI dokáže vytvárať originálne klipy z jedného alebo viacerých kúskov textu, nie je v technologickom svete seizmickou novinkou. Minulý rok výskumníci podrobne opísali, ako systém využíva neurónové siete - vrstvy matematických funkcií modelovaných podľa biologických neurónových sietí (neurónov) - na vytváranie útržkov informácií. Video má dĺžku 32 snímok a veľkosť 64 × 64 pixelov z mnohých evokujúcich popisov, napr. ako „hrať futbal na trávniku“. Podľa nového článku zverejneného na Arxiv.org sa však vedcom z Disney Research a Rutgers podarilo posunúť túto myšlienku o krok ďalej pomocou modelu umelej inteligencie s krížovými slovami. Od začiatku do konca je možné vytvoriť hrubý dej ako aj video popisy textov zo scenárov. Konkrétne, vedcov model prevodu textu na animáciu pomáha vytvárať animácie bez potreby anotačných údajov – predbežný krok, ktorý sa používa na poskytnutie popisného vstupného textu pre aktivity.

„Automatické generovanie animácií z textu v prirodzenom jazyku je veľmi užitočná technológia, ktorú možno použiť v mnohých oblastiach, ako je písanie filmových scenárov alebo vytváranie inštruktážnych videí. Tieto systémy AI budú obzvlášť cenné, keď sa použijú na skriptovanie, pretože umožnia rýchlejšie opakovanie, prototypovanie a overenie konceptu. V tomto výskume sme úspešne vyvinuli systém prevodu textu na animáciu, ktorý dokáže uspokojivo zvládnuť zložité vety. Účelom tohto systému AI nie je úplne nahradiť scenáristov alebo scenáristov, ale vytvoriť AI asistenta schopného efektívne podporovať a uľahčovať prácu scenáristov, zaujímavejšou,“ zdieľal výskumný tím.

Ako vedci vysvetlili, preklad textu do animácie nie je jednoduchá úloha. V skutočnosti vety (vstupné údaje) aj animácie (výstupné údaje) nemajú pevnú štruktúru. To je tiež dôvod, prečo väčšina súčasných nástrojov na prevod textu na video nedokáže zvládnuť zložité vzorce viet. Aby sa riešili obmedzenia súčasných systémov, výskumný tím vytvoril modulárnu neurónovú sieť, ktorá obsahuje množstvo komponentov, ako napríklad: Nový modul na analýzu skriptov, ktorý automaticky dynamicky izoluje relevantný text od popisov scén v skripte; modul na spracovanie prirodzeného jazyka, ktorý zjednodušuje zložité vzorce viet pomocou súboru jazykových pravidiel a extrahuje informácie zo zjednodušených viet do preddefinovaných akčných reprezentácií; a animačný modul zodpovedný za konverziu uvedených reprezentácií do viacerých animačných sekvencií.

Disneyov model AI generuje animované sekvencie zo scenárov

Podľa vedcov tento zjednodušený prístup výrazne uľahčuje extrahovanie kľúčových informácií o skriptoch a ich systém bude schopný automaticky identifikovať, kedy má časť kódu konkrétnu syntaktickú štruktúru, a potom ju rozložiť a poskladať do jednoduchších viet a potom rekurzívne spracovávať, kým nie je možné ďalšie zjednodušenie. Ďalší „koordinačný krok“ bude aplikovaný na vety, ktoré majú rovnaký syntaktický vzťah a zároveň plnia rovnakú funkčnú úlohu. A nakoniec, simulátor slovnej zásoby, ktorý zodpovedá akciám opísaným vo vetách, bude zjednodušený pomocou 52 rôznych animácií (ktoré možno rozšíriť na 92 ​​animácií pomocou slovníka synoným).význam) v preddefinovanej knižnici.

Systém s názvom Cardinal potom tieto animácie používa ako vstup pre akcie a vytvára predvizualizácie v Unreal – populárnom engine videohier vyvinutom spoločnosťou Epic Games. Na základe preddefinovanej knižnice animácií sa predinštalujú objekty a tiež modely, ktoré môže použiť na vytváranie postáv, čo pomáha vytvárať 3D animačné videá, ktoré presne zodpovedajú spracovanému scenáru.

Disneyov model AI generuje animované sekvencie zo scenárov

Na trénovanie tohto špičkového systému začali výskumníci zostavovať databázu popisov scén zloženú z 996 scenárov, čerpajúcich z viac ako 1000 skriptov prevzatých z voľne dostupných zdrojov vrátane IMSDb, SimplyScripts a ScriptORama5. Celkovo tento korpus obsahuje 525 708 popisov obsahujúcich 1 402 864 viet, z ktorých 920 817 (viac ako 40 %) má aspoň jedno sloveso opisujúce dej.

V kvalitatívnom experimente vedci požiadali 22 účastníkov, aby ohodnotili 20 systémovo generovaných animácií na 5-bodovej škále (napr. je zobrazené video vhodne animované vzhľadom na textový obsah? text? alebo koľko textových informácií bolo popísaných vo videu a koľko informácií vo videu bolo spomenutých v texte), 68 % účastníkov uviedlo, že systém vytvoril efektívne animácie.reálna hodnota zo vstupných scenárov – nie obzvlášť vysoká, ale veľmi chvályhodná.

To ukazuje, že toto nie je skutočne dokonalý systém. V skutočnosti zoznam akcií a ich objektov nie je vyčerpávajúci a niekedy proces lexikálneho zjednodušenia nedokáže úspešne namapovať zložité slovesá na podobné animátory, alebo je možné vytvoriť len niekoľko jednoduchých viet pre sloveso, ktoré má v pôvodnej vete viacero predmetov. . Je to však ešte mladá štúdia a takéto obmedzenia sú úplne pochopiteľné. Vedci majú v úmysle v blízkej budúcnosti odstrániť vyššie uvedené nedostatky.

Disneyov model AI generuje animované sekvencie zo scenárov

„Interné a externé hodnotenia ukázali primeranú výkonnosť tohto systému a chceli sme využiť diskurzné informácie skúmaním postupnosti akcií opísaných v textových fragmentoch. To tiež pomôže vyriešiť nejasnosti v texte týkajúce sa akcií. Okrem toho môže byť náš systém použitý na generovanie údajov potrebných na trénovanie podobných end-to-end neurónových systémov,“ povedal tím.


Ako spôsobuje umelá inteligencia revolúciu v softvéri Windows?

Ako spôsobuje umelá inteligencia revolúciu v softvéri Windows?

Umelá inteligencia (AI) je rýchlo sa vyvíjajúca technológia, ktorá by mohla spôsobiť revolúciu v spôsobe, akým používame softvér a ako s ním komunikujeme.

Facebook oznámil výsledky programu Deepfake Detection Challenge

Facebook oznámil výsledky programu Deepfake Detection Challenge

Minulý september Facebook oznámil program, ktorý si získal veľkú pozornosť v technologickom svete, najmä umelej inteligencii (AI) s názvom „Deepfake Detection Challenge“.

Spoločnosť Microsoft oznámila DeepSpeed, novú knižnicu hlbokého učenia, ktorá môže podporovať školenie modelov AI v super veľkom meradle

Spoločnosť Microsoft oznámila DeepSpeed, novú knižnicu hlbokého učenia, ktorá môže podporovať školenie modelov AI v super veľkom meradle

Microsoft Research nedávno spôsobil rozruch vo svete výskumu umelej inteligencie (AI), keď oznámil úspešný vývoj DeepSpeed, knižnice na optimalizáciu hlbokého učenia, ktorú možno použiť na trénovanie obrovských modelov AI s rozsahom až 100 miliárd parametrov.

Takto AI poráža najlepších hráčov Dota 2

Takto AI poráža najlepších hráčov Dota 2

6. augusta 2018 umelá inteligencia OpenAI Elona Muska oficiálne porazila 5 veteránov Dota 2 vrátane Blitz, Capitalist, Fog, Merlini a MoonMeander.

Robotické ruky dosahujú obratnosť, ktorá nie je nižšia ako u ľudí

Robotické ruky dosahujú obratnosť, ktorá nie je nižšia ako u ľudí

Výskumníci úspešne vyvinuli algoritmy umelej inteligencie, ktoré môžu poskytnúť robotom pôsobivé možnosti manipulácie

Meta hovorí, že zdieľanie technológie AI nemá žiadne nevýhody

Meta hovorí, že zdieľanie technológie AI nemá žiadne nevýhody

Vedúci predstavitelia spoločnosti Meta Platforms Inc. na podujatí vo štvrtok uviedli, že neexistujú žiadne zásadné obmedzenia na verejné zdieľanie jej technológie AI, aj keď mnohí kolegovia majú svoj spôsob.

6 spôsobov, ako aplikovať AI v hudobnej produkcii

6 spôsobov, ako aplikovať AI v hudobnej produkcii

Existuje mnoho prípadov použitia umelej inteligencie (AI). Technológia zmenila spôsob, akým pracujeme, tvoríme umenie, píšeme a dokonca produkujeme hudbu.

Majster písania 11.0.868

Majster písania 11.0.868

Typing Master je ľahko použiteľný nástroj, ktorý vám umožní zlepšiť presnosť a rýchlosť písania. Ak nie ste dobrí v písaní, prevod nápadov na slová na obrazovke môže byť problém.

Intel odhaľuje nový čip AI, ktorý bude konkurovať GPU od Nvidie

Intel odhaľuje nový čip AI, ktorý bude konkurovať GPU od Nvidie

Podrobnosti sú vzácne, ale Intel tvrdí, že nové čipy zlepšia tréningové časy hlbokého učenia.

Ako používať ChatGPT na vytváranie prezentácií

Ako používať ChatGPT na vytváranie prezentácií

Nudí vás robiť prezentácie starým spôsobom? Potom vás pozývame, aby ste sa naučili používať ChatGPT na vytváranie prezentácií, ktoré ohromia vaše publikum.