Az Amazon mesterséges intelligencia rendszere 15%-kal csökkenti az Alexa hangfelismerési hibáit.

Az Amazon mesterséges intelligencia rendszere 15%-kal csökkenti az Alexa hangfelismerési hibáit.

Néhány hónappal ezelőtt az Amazon részletezett számos olyan problémát, amelyek megakadályozták, hogy az Alexa pontos választ adjon, amikor a felhasználók felébresztették a virtuális asszisztenst bizonyos TV-modellekben, internetes vagy rádiós hirdetésekben. Hiszen itt az a fő kérdés, hogy az Amazon hangsegédje hogyan tudja hatékonyan kiszűrni a környezet háttérzajt, hogy pontosabb visszajelzést adjon a felhasználóknak. A közelmúltban egy blogbejegyzésben és a kapcsolódó kutatási cikkben, az End-to-End Anchorred Speech Recognition néven, az Amazon mérnökei konkrétan bemutattak egy új, mesterséges intelligencián alapuló zajszigetelési technikát, amely 15%-kal javíthatja az Alexa hangfelismerését és parancsait. A rendszer működésével kapcsolatos részletesebb információk várhatóan az év folyamán Brightonban megrendezésre kerülő Nemzetközi Akusztikai, Beszéd- és Jelfeldolgozási Konferencián kerülnek bemutatásra.

Az Amazon mesterséges intelligencia rendszere 15%-kal csökkenti az Alexa hangfelismerési hibáit.

„Valójában mindig úgy igyekszünk javítani Alexa teljesítményén, hogy megtanítjuk neki, hogyan „figyelmen kívül hagyja” azokat a parancsokat, amelyeket nem neki szántak, vagyis tudja, hogyan válassza ki a parancsokat a környező környezetből kiszűrődő számtalan zaj közül. Ehhez feltételezzük, hogy a hangszóró aktivál egy Alexa-kompatibilis eszközt egy bizonyos ébresztőszó kimondásával – általában „Alexa”. környezet. Alapvetően technikánk segít abban, hogy gyorsan „elfogjon” olyan hangokat, amelyek ébrenléti szavak lehetnek (általában intonáció vagy fonémák hasonlósága alapján), és összehasonlítjuk őket ébrenléti szavakkal. Szabvány a mondatok pontos azonosításához. Ezután azt a mondatot, amelynek elemei a legjobban egyeznek a szokásos ébresztőszóval, az Alexa parancsként fogja fel, míg a többi mondatot háttérzajnak tekinti" - mondta Xin Fan, a projektért felelős tudóscsoport vezetője. Alexa AI elmagyarázza.

Ahelyett, hogy egy külön mesterséges intelligencia rendszert tanítottak volna a háttérzaj és az ébresztő szavak megkülönböztetésére, Xin Fan és munkatársai egyesítették a szóillesztési mechanizmusukat egy intelligencia alapú beszédfelismerő modellel. A tudósok a dekóder mesterséges intelligencia architektúrájának két variációját tesztelték egymás után – vagyis olyan architektúrát használva, amely feldolgozza a bemeneti adatokat (az audiojel ezredmásodperces pillanatfelvételei), hogy megfelelő kimeneti szekvenciát állítsanak elő (a hang fonemikus megjelenítése) – és , mint a legtöbb hagyományos kódoló-dekódolási technikánál, a kódoló komponens a bemeneti adatokat vektor rögzített hosszúságú (számsorozat) összegzi, és kimeneti adatokká alakítja. Mindeközben egy speciális figyelemmechanizmus, amely „kiképzett" a környező környezet egy vagy több beszédláncában lévő ébresztőszavak néhány alapvető jellemzőjének észlelésére, lesz felelős a halmaz „irányításáért". A dekódolás nagyobb figyelmet fordít a vektor ezen jellemzőire.

Az Amazon mesterséges intelligencia rendszere 15%-kal csökkenti az Alexa hangfelismerési hibáit.

Egy kísérlet során a kutatók megtanították az egyik mesterséges intelligencia-modelljüket, hogy nagyobb hangsúlyt fektessenek a szavak kiejtésének felismerésére, először egy olyan komponens hozzáadásával, amely közvetlenül hasonlította össze a szavak hangjait. Wake word különféle kiejtéssel, majd ezeket az adatokat egy másik különálló kiejtés bemeneteként használja fel. komponens, amelyet arra tanítottak, hogy tömörítse a kódolóvektor bitjeit. Az eredmények érdekesek voltak, ez a modell 15%-hoz képest 13%-ra csökkentette a hibaarányt.


Az AI-alapú rendszert az orvvadászok észlelésére tervezték

Az AI-alapú rendszert az orvvadászok észlelésére tervezték

A vadászok gyakran éjszaka vadásznak, ezért észlelésükre drónokra szerelt infravörös kamerákat használnak. A probléma az, hogy mivel az orvvadász és az állat is hőt bocsát ki, nehéz lehet pontosan azonosítani őket.

5 ingyenes AI chatbot az Ön webhelyéhez

5 ingyenes AI chatbot az Ön webhelyéhez

Képzelje el, hogy alvás közben is válaszol az ügyfelek kérdéseire. Íme, mit tehetnek az ingyenes mesterséges intelligencia chatbotok az Ön webhelyén.

Csaposok, figyelem: Ez a robot mindössze 1 perc alatt képes összekeverni egy koktélt

Csaposok, figyelem: Ez a robot mindössze 1 perc alatt képes összekeverni egy koktélt

Japán elöregedő és csökkenő népessége miatt az országból jelentős számú fiatal munkaerő hiányzik, különösen a szolgáltatási szektorban.

A Character.AI finanszírozást keres, hogy a cég értékét több mint 5 milliárd dollárra emelje

A Character.AI finanszírozást keres, hogy a cég értékét több mint 5 milliárd dollárra emelje

A Character.AI, a Generatív mesterséges intelligencia és a chatbot technológiára összpontosító startup állítólag tárgyalásokat folytat olyan finanszírozás megszerzéséről, amely több mint 5 milliárd dollár értékben érheti el a céget.

A mesterséges intelligencia segít tisztázni egy híres, közel 400 éves színdarab szerzőjével kapcsolatos vitát

A mesterséges intelligencia segít tisztázni egy híres, közel 400 éves színdarab szerzőjével kapcsolatos vitát

A VIII. Henrik az angol irodalom történetének egyik legklasszikusabb darabja, amelyet két híres szerző, William Shakespeare és John Fletcher írt 1623-ban.

Telepítse az AI-t mikrohullámú sütőre, hogy képzeletbeli barátja valóra váljon, de ami létrejön, az egy gyilkos gép

Telepítse az AI-t mikrohullámú sütőre, hogy képzeletbeli barátja valóra váljon, de ami létrejön, az egy gyilkos gép

Egy YouTuber és egy brazíliai mérnök, Lucas Rizzotto a közelmúltban megosztotta a Twitteren azt a történetet, hogy megvalósította képzeletbeli barátját – egy mikrohullámú sütőt a házban, aki mesterséges intelligenciát használ, de élete "egyik legfélelmetesebb élményét" kapta.

A Microsoft Research távoli egészségmegfigyelési technológiát fejleszt, kizárólag okostelefonok kameráival

A Microsoft Research távoli egészségmegfigyelési technológiát fejleszt, kizárólag okostelefonok kameráival

A kutatók felfedezték, hogy a webkamerák és az okostelefonok kamerái kombinálhatók speciális mesterséges intelligencia-algoritmusokkal, hogy rendkívül hatékony távoli személyes egészségfigyelő rendszerként működjenek.

A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

Úgy tűnik, hogy a modern élet egyre negatívabb hatással van az emberi kapcsolatokra.

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

Az élgráfokon alapuló összetett neurális hálózati architektúra segítségével a Google Brain mesterséges intelligencia modellje az emberi időnek csupán töredéke alatt képes alaprajzokat megtervezni.

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A Python számos nagy könyvtárral és keretrendszerrel rendelkezik, amelyek kényelmesek a kódíráshoz és a számítástechnika fejlesztéséhez. A Docs.NeoTechSystems felkéri Önt, hogy beszéljen néhány hasznos Python-eszközről mind a gépi tanulási, mind az adattudományi alkalmazásokhoz.