Meta predstavuje Voicebox, model AI, ktorý podporuje spracovanie zvuku pre tvorcov

Meta predstavuje Voicebox, model AI, ktorý podporuje spracovanie zvuku pre tvorcov

Po nespočetných fámach spoločnosť Meta konečne oficiálne oznámila svoj model AI najnovšej generácie s názvom Voicebox. Tento model je navrhnutý tak, aby pomohol tvorcom obsahu efektívne zvládnuť úlohy súvisiace s generovaním hlasu, ako je úprava zvuku, vzorkovanie a štylizácia, a to aj bez špeciálneho školenia, čo je možné prostredníctvom údajov v kontexte.

Meta sebaisto potvrdzuje, že tento nový model AI bude „prospešný mnohým ľuďom na celom svete“, a to nielen v oblasti tvorby obsahu. Napríklad pomôcť nevidomým ľuďom počuť textové správy pomocou ich hlasu, ako aj umožniť ľuďom hovoriť cudzími jazykmi vlastným hlasom.

Samotný Voicebox je propagovaný ako schopný vytvárať vysokokvalitné zvukové klipy a upravovať vopred nahrané zvukové klipy, aby sa odstránili nechcené prerušenia, ako sú klaksóny auta, pričom si zachováva rovnaký viacjazyčný obsah a štýl (produkuje reč v šiestich rôznych jazykoch). Plánovaný budúci vývoj modelu Meta zahŕňa poskytovanie prirodzených hlasov pre vizuálnych asistentov alebo postavy v hrách v metaverze.

Meta tiež porovnávala Voicebox s inými modelmi AI so spracovaním zvuku, ktoré sú v súčasnosti na trhu, konkrétne s kľúčovými konkurentmi, ako sú Vall-E a YourTTS. Celkovo je model Meta pokročilý a prekonáva konkurenciu pri porovnaní chybovosti Wordu a podobnosti štýlu.

Meta predstavuje Voicebox, model AI, ktorý podporuje spracovanie zvuku pre tvorcov

Meta predstavuje Voicebox, model AI, ktorý podporuje spracovanie zvuku pre tvorcov

Voicebox je postavený na Flow Matching. Toto je najnovší neautoregresívny generatívny model Meta, ktorý dokáže spracovať vysoko nedeterministické mapovanie medzi textom a rečou. To umožňuje Voiceboxu učiť sa z mnohých rôznych typov rečových údajov bez toho, aby ich museli starostlivo označovať, čo mu dáva možnosť prístupu k rôznorodejším a rozsiahlejším tréningovým údajom. K dnešnému dňu bol Voicebox vyškolený na viac ako 50 000 hodinách nahrávok reči a prepisov audiokníh v angličtine, francúzštine, španielčine, nemčine, poľštine a portugalčine.

Zatiaľ čo táto technológia by mohla začať novú éru AI v spracovaní zvuku, Meta uznáva, že by mohla predstavovať potenciál pre zneužitie a neúmyselné poškodenie. Výskumný dokument Meta zdieľaný o Voiceboxe obsahuje podrobnosti o tom, ako spoločnosť vybudovala vysoko efektívny klasifikátor, ktorý dokáže rozlíšiť medzi autentickými hlasmi a hlasmi generovanými Voiceboxom.

Meta nesprístupní program AI ​​Voicebox na verejné použitie ani nezverejní zdrojový kód, aspoň zatiaľ.


Robotické ruky dosahujú obratnosť, ktorá nie je nižšia ako u ľudí

Robotické ruky dosahujú obratnosť, ktorá nie je nižšia ako u ľudí

Výskumníci úspešne vyvinuli algoritmy umelej inteligencie, ktoré môžu poskytnúť robotom pôsobivé možnosti manipulácie

Meta hovorí, že zdieľanie technológie AI nemá žiadne nevýhody

Meta hovorí, že zdieľanie technológie AI nemá žiadne nevýhody

Vedúci predstavitelia spoločnosti Meta Platforms Inc. na podujatí vo štvrtok uviedli, že neexistujú žiadne zásadné obmedzenia na verejné zdieľanie jej technológie AI, aj keď mnohí kolegovia majú svoj spôsob.

6 spôsobov, ako aplikovať AI v hudobnej produkcii

6 spôsobov, ako aplikovať AI v hudobnej produkcii

Existuje mnoho prípadov použitia umelej inteligencie (AI). Technológia zmenila spôsob, akým pracujeme, tvoríme umenie, píšeme a dokonca produkujeme hudbu.

Majster písania 11.0.868

Majster písania 11.0.868

Typing Master je ľahko použiteľný nástroj, ktorý vám umožní zlepšiť presnosť a rýchlosť písania. Ak nie ste dobrí v písaní, prevod nápadov na slová na obrazovke môže byť problém.

Intel odhaľuje nový čip AI, ktorý bude konkurovať GPU od Nvidie

Intel odhaľuje nový čip AI, ktorý bude konkurovať GPU od Nvidie

Podrobnosti sú vzácne, ale Intel tvrdí, že nové čipy zlepšia tréningové časy hlbokého učenia.

Ako používať ChatGPT na vytváranie prezentácií

Ako používať ChatGPT na vytváranie prezentácií

Nudí vás robiť prezentácie starým spôsobom? Potom vás pozývame, aby ste sa naučili používať ChatGPT na vytváranie prezentácií, ktoré ohromia vaše publikum.

Hlboká fake od Samsungu dokáže prinútiť temného mnícha Rasputina spievať skutočne

Hlboká fake od Samsungu dokáže prinútiť temného mnícha Rasputina spievať skutočne

Okrem synchronizácie pohybov pier a úst dokáže tento model umelej inteligencie upraviť aj pohyby obočia, ako aj žmurkanie očí, aby tváre, ktoré vytvára, vyzerali prirodzenejšie.

Winnow používa počítačové videnie na zníženie odpadu pri spracovaní potravín

Winnow používa počítačové videnie na zníženie odpadu pri spracovaní potravín

Možno neviete, ale podľa Organizácie Spojených národov pre výživu a poľnohospodárstvo (FAO) sa asi tretina celosvetovo vyprodukovaných potravín nikdy nedostane na ľudský stôl.

Mathway

Mathway

Mathway je veľmi užitočná aplikácia, ktorá vám môže pomôcť vyriešiť všetky tie matematické problémy, ktoré si vyžadujú zložitejší nástroj, než je vstavaná kalkulačka vášho zariadenia.

Ako AI ovplyvnila každodenný život?

Ako AI ovplyvnila každodenný život?

Umelá inteligencia existuje nielen okolo nás, ale mnohými rôznymi spôsobmi ovplyvňuje aj každodenný život.