Adobe Presenter
Adobe Presenter je e-learningový softvér vydaný spoločnosťou Adobe Systems dostupný na platforme Microsoft Windows ako doplnok Microsoft PowerPoint.
Výskumníci z výskumného centra AI spoločnosti Samsung v Cambridge vo Veľkej Británii spolu s odborníkmi na počítačovú vedu z Imperial College London spolupracovali na projekte vytvorenia siete protivníkov. generative adversarial network (GAN), ktorá dokáže animovať a dokonale synchronizovať pohyby tváre 2D obrázkov so zvukovými klipmi obsahujúcimi ľudské hlasy.
Okrem synchronizácie pohybov pier a úst dokáže tento model umelej inteligencie upraviť aj pohyby obočia a žmurkanie očí, aby tváre, ktoré vytvára, vyzerali prirodzenejšie. Najdôležitejšou úlohou však stále bude synchronizácia pier a úst s vydávaným zvukom. Dnes sa tento krok často robí počas dodatočných úprav alebo pomocou počítačovej grafiky.
Centrum AI spoločnosti Samsung
Výskumníci sa domnievajú, že tento model by sa dal použiť na automatické generovanie hovoriacich tvárí pre kreslené postavičky tým najprirodzenejším spôsobom, čím by sa zlepšila viditeľnosť pri videohovoroch s nízkou šírkou pásma, čím by sa zabezpečila lepšia synchronizácia úst alebo dabing pre zahraničné filmy.
Spomedzi príkladov tohto výskumu zdieľaných na YouTube je najpôsobivejšie video zobrazujúce notoricky známeho ruského mystika Rasputina (1869 - 1919), ktorý „vystupuje“ v piesni speváčky Halo artist Beyoncé. Niektoré ďalšie videá sú tiež veľmi pozoruhodné, ako napríklad neskorí rapperi 2Pac a Biggie, ktorí spievajú covery svojich diel, alebo veľký vedec Albert Einstein čítajúci citát o bežnom jazyku vedy.
Temný mních Rasputin hrá pieseň Halo
Okrem toho existuje mnoho ďalších zaujímavých príkladov videí, môžete si ich pozrieť na: https://sites.google.com/view/facial-animation/home
Správy o vyššie uvedenom výskume prišli len mesiac po tom, čo iné výskumné centrum AI spoločnosti Samsung v Moskve predstavilo projekt na vytváranie 2D animácií pomocou umelej inteligencie bez použitia modelov. Je známe, že táto technológia môže byť použitá na vytvorenie presvedčivejších digitálnych avatarov alebo deepfake obrázkov.
Používanie sietí GAN na falšovanie digitálnych médií, ako sú obrázky a videá, sa v posledných rokoch objavilo ako významný trend vo všeobecnej oblasti AI na celom svete. V rámci konferencií o umelej inteligencii ako ICML, CVPR a mnohých ďalších významných udalostí od začiatku roka až doteraz bolo predstavených mnoho sofistikovaných modelov GAN.
Rasputin a podobne ako speváčka Beyoncé
Medzi niektoré pozoruhodné modely s extrémne vysokým aplikačným potenciálom patrí GauGAN od Nvidie, ktorý dokáže premeniť čmáranice v štýle MS Paint na umelecké „majstrovské diela“. Alebo CollaGEN, metóda vytvorená kórejskými výskumníkmi na nahradenie množstva chýbajúcich údajov na každom obrázku.
Hoci potenciál hlbokých falošných nástrojov prispievať v mnohých rôznych oblastiach je obrovský, potenciálne riziká, ktoré prinášajú, sú pre vedcov tiež bolesťou hlavy.
V skutočnosti sa táto technológia často využíva na napodobňovanie známych ľudí (hercov, spevákov, modeliek...) vo falošných videách alebo ešte horšie, v porno filmoch. Je vidieť, že táto technológia spôsobila silný šok, pretože veľa ľudí verilo, že je to pravda. To ovplyvňuje nielen česť a dôstojnosť falšovanej osoby, ale spôsobuje to aj verejnú mienku a vyvoláva mnohé polemiky alebo ešte horšie konflikty.
Deepfake obsahuje mnoho potenciálnych rizík
Možno v budúcnosti budú musieť vedci, ako aj štátne riadiace agentúry, sedieť spolu, aby našli konvencie na správne a bezpečné používanie tejto úžasnej technológie pre komunitu.
Adobe Presenter je e-learningový softvér vydaný spoločnosťou Adobe Systems dostupný na platforme Microsoft Windows ako doplnok Microsoft PowerPoint.
Neviditeľná klávesnica? Znie to zaujímavo, ale stále dosť nejasne...
Včera, 5. mája, spoločnosť Google oficiálne vydala školiaci dátový sklad AI Google-Landmarks-v2 s otvoreným zdrojovým kódom ako dôležitý krok v pláne úspešného vývoja modelov počítačového videnia, ktoré dokážu rýchlejšie, presnejšie a sofistikovanejšie rozpoznávať orientačné body na celom svete.
Umelá inteligencia hrá čoraz dôležitejšiu rolu v sérii podstatných oblastí života ako je priemysel, poľnohospodárstvo, zdravotníctvo, školstvo... A výnimkou je aj armáda.
Bard prezradil, že nemá rád vlastný Android od Google a myslí si, že iOS je lepší operačný systém.
S používaním chatbotov AI sú spojené neodmysliteľné riziká, ako sú obavy o súkromie a potenciálne kybernetické útoky. Pri interakcii s chatbotmi je dôležité postupovať opatrne.
Bard je generatívna AI navrhnutá na generovanie textu z prirodzene napísaných dopytov. Bard používa vlastný jazykový model Google, LaMDA (Language Model for Dialogue Applications).
Ginger je bezplatná kontrola pravopisu a gramatiky.
Robotické rameno je mäkké, obratné a mimoriadne inteligentné, schopné identifikovať a uchopiť takmer akýkoľvek predmet v rámci svojich možností, s tvarom inšpirovaným chápadlami chobotnice.
Nové antibiotické zlúčeniny dokážu ľahko zabiť aj niektoré dnešné nebezpečné kmene baktérií odolných voči antibiotikám.