Systém umelej inteligencie Amazonu pomáha znížiť chyby rozpoznávania hlasu na Alexe o 15 %.

Systém umelej inteligencie Amazonu pomáha znížiť chyby rozpoznávania hlasu na Alexe o 15 %.

Pred niekoľkými mesiacmi Amazon podrobne opísal množstvo problémov, ktoré Alexe bránili v poskytovaní presných odpovedí, keď používatelia prebudili virtuálneho asistenta na určitých modeloch televízorov, v internetových alebo rádiových reklamách. Koniec koncov, hlavným problémom je, ako môže hlasový asistent Amazonu efektívne odfiltrovať hluk pozadia z prostredia, aby používateľom poskytol presnejšiu spätnú väzbu. Nedávno v blogovom príspevku a sprievodnom výskumnom článku s názvom End-to-End Anchored Speech Recognition inžinieri Amazonu konkrétne predstavili novú techniku ​​izolácie hluku založenú na umelej inteligencii, ktorá môže pomôcť zlepšiť rozpoznávanie hlasu a príkazy Alexa o 15 %. Očakáva sa, že podrobnejšie informácie o tom, ako systém funguje, budú predstavené na medzinárodnej konferencii o akustike, reči a spracovaní signálov, ktorá sa bude konať v Brightone koncom tohto roka.

Systém umelej inteligencie Amazonu pomáha znížiť chyby rozpoznávania hlasu na Alexe o 15 %.

„V skutočnosti sa vždy snažíme zlepšiť Alexin výkon tým, že ju učíme, ako „ignorovať“ príkazy, ktoré nie sú pre ňu určené, inými slovami, vedieť vyberať príkazy spomedzi nespočetných zvukov vychádzajúcich z okolitého prostredia. Aby sme tak urobili, predpokladáme, že reproduktor aktivuje zariadenie s podporou Alexa vyslovením konkrétneho slova na prebudenie – zvyčajne „Alexa.“ – a toto je kľúčová fráza, ktorú musí virtuálny asistent izolovať a identifikovať v chaose zvukov zvonku. životné prostredie. Naša technika v podstate pomôže rýchlo „zachytiť“ zvuky, ktoré môžu byť bdelými slovami (zvyčajne na základe podobnosti v intonácii alebo fonémach) a porovnať ich s bdelými slovami. štandard na presnú identifikáciu viet. Potom vetu, ktorej prvky sa najviac zhodujú so štandardným budiacim slovom, bude Alexa chápať ako príkaz, zatiaľ čo ostatné vety budú považovať za hluk v pozadí,“ povedal Xin Fan, vedúci tímu vedcov zodpovedných za projekt. Alexa AI vysvetľuje.

Namiesto trénovania samostatného systému AI na rozlíšenie medzi hlukom v pozadí a prebudenými slovami, Xin Fan a kolegovia zlúčili svoj mechanizmus zhody slov s modelom rozpoznávania reči založeným na inteligencii, štandardne umelým. Vedci testovali postupne dve varianty architektúry AI dekodéra – to znamená použitie architektúry, ktorá spracováva vstupné dáta (milisekundové snímky zvukového signálu), aby sa vytvorila zodpovedajúca výstupná sekvencia (fonemické vykreslenie zvuku) – a Ako pri väčšine konvenčných techník kódovania a dekódovania, kódovací komponent sumarizuje vstupné dáta ako vektor s pevnou dĺžkou (reťazec čísel) a konvertuje ich na výstupné dáta. Medzitým, špeciálny mechanizmus pozornosti, "vycvičený" na detekciu niektorých základných charakteristík budiacich slov v jednom alebo viacerých rečových reťazcoch z okolitého prostredia, bude zodpovedný za "vedenie" množiny. dekódovanie venuje väčšiu pozornosť týmto vlastnostiam vo vektore.

Systém umelej inteligencie Amazonu pomáha znížiť chyby rozpoznávania hlasu na Alexe o 15 %.

V experimente výskumníci trénovali jeden zo svojich modelov AI tak, aby kládol väčší dôraz na rozpoznávanie výslovnosti slov, najprv pridaním komponentu, ktorý priamo porovnával zvuky slov. prebudiť slovo s rôznymi výslovnosťami a potom použiť tieto výsledné údaje ako vstup do iného samostatného komponent, ktorý bol natrénovaný na kompresiu bitov kódovacieho vektora. Výsledky boli zaujímavé, tento model znížil chybovosť na 13 % oproti 15 %.


Systém založený na AI je navrhnutý na odhaľovanie pytliakov

Systém založený na AI je navrhnutý na odhaľovanie pytliakov

Poľovníci často lovia v noci, a preto sa na ich detekciu používajú infračervené kamery namontované na dronoch. Problém je, že keď pytliak aj zviera vyžarujú teplo, môže byť ťažké ich presne identifikovať.

5 bezplatných chatbotov AI pre váš web

5 bezplatných chatbotov AI pre váš web

Predstavte si, že odpovedáte na otázky zákazníkov, aj keď spíte. Tu je to, čo môžu bezplatné chatboty AI urobiť pre váš web.

Barmani, pozor: Tento robot dokáže namiešať kokteil už za 1 minútu

Barmani, pozor: Tento robot dokáže namiešať kokteil už za 1 minútu

V dôsledku starnutia a klesajúcej populácie Japonska v krajine chýba značný počet mladých pracovníkov, najmä v sektore služieb.

Character.AI hľadá financie na zvýšenie hodnoty spoločnosti na viac ako 5 miliárd dolárov

Character.AI hľadá financie na zvýšenie hodnoty spoločnosti na viac ako 5 miliárd dolárov

Character.AI, startup zameraný na generatívnu AI a technológiu chatbotov, údajne rokuje o získaní financií, ktoré by mohli oceniť spoločnosť na viac ako 5 miliárd dolárov.

AI pomáha objasniť polemiku o autorovi slávnej takmer 400 rokov starej hry

AI pomáha objasniť polemiku o autorovi slávnej takmer 400 rokov starej hry

Henry VIII je jednou z najklasickejších hier v histórii anglickej literatúry, ktorú napísali dvaja slávni autori William Shakespeare a John Fletcher v roku 1623.

Nainštalujte AI na mikrovlnnú rúru, aby sa váš imaginárny priateľ stal skutočnosťou, ale to, čo sa vytvorí, je zabijácky stroj

Nainštalujte AI na mikrovlnnú rúru, aby sa váš imaginárny priateľ stal skutočnosťou, ale to, čo sa vytvorí, je zabijácky stroj

YouTuber a inžinier z Brazílie menom Lucas Rizzotto sa nedávno na Twitteri podelili o príbeh, ako si uvedomil svojho imaginárneho priateľa – mikrovlnnú rúru v dome, používa AI, no získal „jeden z najdesivejších zážitkov“ svojho života.

Microsoft Research vyvíja technológiu vzdialeného monitorovania zdravia iba pomocou kamier smartfónov

Microsoft Research vyvíja technológiu vzdialeného monitorovania zdravia iba pomocou kamier smartfónov

Výskumníci zistili, že webové kamery a kamery smartfónov možno kombinovať so špecializovanými algoritmami AI, aby fungovali ako mimoriadne efektívne systémy vzdialeného monitorovania osobného zdravia.

Vedci používajú AI, aby ukázali, čo robí šťastné manželstvo

Vedci používajú AI, aby ukázali, čo robí šťastné manželstvo

Zdá sa, že moderný život má čoraz negatívny vplyv na medziľudské vzťahy.

Umelá inteligencia Google dokáže navrhnúť čipy rýchlejšie a lepšie ako ľudia

Umelá inteligencia Google dokáže navrhnúť čipy rýchlejšie a lepšie ako ľudia

Pomocou komplexnej architektúry neurónovej siete založenej na okrajových grafoch dokáže model umelej inteligencie Google Brain navrhnúť pôdorysy za zlomok času, ktorý zaberie človeku.

Najlepšie nástroje Pythonu pre strojové učenie a vedu o údajoch

Najlepšie nástroje Pythonu pre strojové učenie a vedu o údajoch

Python má veľa veľkých knižníc a rámcov, ktoré sú vhodné na písanie kódu a vývoj informatiky. Docs.NeoTechSystems vás pozýva na diskusiu o niektorých užitočných nástrojoch Pythonu pre aplikácie Machine Learning a Data Science.