Tacotron 2, systém umelej inteligencie od Googlu, dokáže zmeniť neživý text na ľudský hlas. Pre Google sa to považuje za veľký krok vpred, ktorý pomáha AI priblížiť sa používateľom.
Na tento účel používa Tacotron 2 dve umelé inteligencie s rôznymi úlohami, prvá sa zameria na konverziu písmen na spektrogramy, druhá (WaveNet). ) premení tieto údaje na zvuk.
Zažite výnimočnú silu nového systému umelej inteligencie od Googlu počúvaním párov identických zvukových súborov vytvorených ľuďmi a Tacotronom 2. Dokážete rozlíšiť, či ide o strojový alebo ľudský hlas?
"George Washington bol prvým prezidentom Spojených štátov."
"To dievča natočilo video o rúžoch zo Star Wars."
"Autobusy nie sú problémom, v skutočnosti poskytujú riešenie."
"Autobusy nie sú PROBLÉM, v skutočnosti poskytujú RIEŠENIE."
"Generatívna sieť protivníkov alebo variačný automatický kódovač."
"Basilárna membrána a otolaryngológia nie sú autokorelácie."
"Prečítal to celé."
"Číta knihy".
Podľa aktuálnych oznámení dokáže Tacotron 2 spracovať slová, ktoré sa ťažko vyslovujú, s ktorými sa ľudia možno nikdy predtým nestretli, dokáže analyzovať, aby našiel zameranie, ktoré je potrebné zdôrazniť vo vete, a zdôrazniť to, čo je napísané. alebo pomocou vlastnej analýzy odhaliť základné pravopisné chyby.
Systém Tacotron 2 v súčasnosti vytvára iba jediný ženský hlas, hovoriaci po anglicky a slúži na komunikáciu s virtuálnou asistentkou Google Assistant. Google v budúcnosti určite vytvorí viac hlasov a Tacotron 2 bude aplikovaný na mnoho rôznych platforiem.
Pozrieť viac: