A Facebook megalkotta az AI-t, amely 100 különböző nyelvet képes lefordítani anélkül, hogy először angolul kellene átmennie

A Facebook megalkotta az AI-t, amely 100 különböző nyelvet képes lefordítani anélkül, hogy először angolul kellene átmennie

A Facebook nemrég nyílt forráskódú egy mesterséges intelligencia modellt, amely lenyűgöző fordítási képességekkel rendelkezik, akár 100 nyelven anélkül, hogy közbenső lépésként először le kellene fordítani őket angolra, ami gyakran megtalálható a mai mesterséges intelligencián alapuló fordítóeszközökön.

Ezt az AI-modellt M2M-100-nak hívják, és jelenleg csak a kutatási projekt szintjén van. A fejlesztési szakaszok befejeztével azonban (a közeljövőben) teljesen megoldható a Facebook-felhasználók bejegyzéseinek és megjegyzéseinek lefordítása – számos nyelvről, a világ különböző nyelveire. A legfrissebb statisztikák szerint jelenleg a Facebook-felhasználók több mint 2/3-a nem használ angol nyelvű kommunikációt ezen a közösségi platformon.

„AI-kutatóink sok éven át keményen dolgoztak azon, hogy egyetlen általános modellt építsenek fel és fejlesszenek ki, amely különféle helyzetekben és feladatokban sok nyelvet képes megérteni. Egyetlen modell, amely támogatja az összes nyelvet, nyelvjárást, valamint a folyamatosan frissített és optimalizált fordításokat, segít abban, hogy jobb élményt nyújtsunk több milliárd Facebook-felhasználó számára ” – mondta a kutató. Az AI Facebook Angela Fan a blogpost.al oldalon közzétett bejegyzésében.

A Facebook megalkotta az AI-t, amely 100 különböző nyelvet képes lefordítani anélkül, hogy először angolul kellene átmennie

Az új AI-modell sokféle fordítást támogat a Facebookon

Az M2M-100 100 különböző nyelvből származó 7,5 milliárd gyakori mondatpárból álló adathalmazra van kiképezve, amelyek mindegyikét az internetről gyűjtötték össze. A Facebook szerint a források mind nyílt forráskódúak, és nyilvános adatokat használnak.

Egy ilyen nagyszabású képzési adatbázis kezeléséhez a Facebook AI kutatói elsősorban a leggyakrabban kért nyelvi fordításokra összpontosítanak, miközben korlátozzák a ritka mondatokat és nyelveket. Ezután 14 különböző csoportba sorolják ezeket a nyelveket, nyelvi, földrajzi és kulturális hasonlóságok alapján. Ez a megközelítés optimálisabbnak tekinthető, mivel a fenti közös jellemzőkkel rendelkező országokban élő emberek többet profitálnak az optimalizált fordításokból egy adott nyelvcsoporton.

A különböző csoportokhoz tartozó nyelvek kis számú hídnyelven keresztül kapcsolódnak össze. Az indiai nyelvcsoport példájában a hindi, a bengáli és a tamil az indoárja nyelvek hídnyelvei. A teljes gyűjtési és kiválasztási folyamat során a kutatók egy 7,5 milliárd párhuzamos mondatból álló adatsort értek el, amely 2200 fordítási iránynak felel meg.

Azon nyelvek esetében, amelyekből hiányoznak a minőségi fordítási adatok, a kutatók a visszafordításnak nevezett módszert alkalmazták szintetikus fordítások létrehozására, amelyek kiegészíthetik a bányászott adatokat.

Összességében ezeknek a technikáknak a kombinációja a világ első olyan többnyelvű gépi fordítási (MMT) modelljét eredményezte, amely 100 nyelv bármelyike ​​között képes fordítani adatokra támaszkodás nélkül. A Facebook közleménye szerint az angol a szabvány.

"Például, ha kínairól franciára fordítanak, a legtöbb jelenlegi többnyelvű fordítási modell angol-központú lesz, a kínai nyelvet angolra és angolról franciára fordítják, mivel az angol képzési adatok a legelérhetőbbek és a legnépszerűbbek. Ezt a motívumot követve modellünk közvetlenül lefordítja a kínai adatokat franciára, hogy biztosítsa a fordítási jelentés maximális megőrzését."

Jelenleg az M2M-100 még nincs beépítve egyetlen termékbe sem, de a tesztek azt mutatják, hogy sokféle fordítást tud támogatni a Facebookon, ahol az emberek továbbra is óránként tesznek közzé tartalmakat, több mint 160 nyelven.


A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

Úgy tűnik, hogy a modern élet egyre negatívabb hatással van az emberi kapcsolatokra.

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

Az élgráfokon alapuló összetett neurális hálózati architektúra segítségével a Google Brain mesterséges intelligencia modellje az emberi időnek csupán töredéke alatt képes alaprajzokat megtervezni.

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A Python számos nagy könyvtárral és keretrendszerrel rendelkezik, amelyek kényelmesek a kódíráshoz és a számítástechnika fejlesztéséhez. A Docs.NeoTechSystems felkéri Önt, hogy beszéljen néhány hasznos Python-eszközről mind a gépi tanulási, mind az adattudományi alkalmazásokhoz.

Az univerzális arc számos azonosítási rendszert képes feltörni

Az univerzális arc számos azonosítási rendszert képes feltörni

Az izraeli Tel Avivi Egyetem informatikusainak egy csoportja a közelmúltban bejelentette, hogy megtalálták a módját, hogy mesterséges intelligencia segítségével megkerüljék a legtöbb biometrikus arcfelismerő technológiát anélkül, hogy ismernék az áldozat arcát.

3 perces, mesterséges intelligencia technológiával készült film megijeszti a japán animeipart

3 perces, mesterséges intelligencia technológiával készült film megijeszti a japán animeipart

Nemrég a Netflix kiadott egy 3 perces animációs filmet The Dog and the Boy címmel, amely mesterséges intelligencia technológiával készült a cég YouTube csatornáján a japán piac számára.

Mathpix Snip 4.1

Mathpix Snip 4.1

A Mathpix Snip egy olyan eszköz, amellyel szöveget, és különösen matematikát lehet kinyerni képekből és dokumentumokból.

Adobe Presenter

Adobe Presenter

Az Adobe Presenter az Adobe Systems által kiadott e-Learning szoftver, amely Microsoft Windows platformon Microsoft PowerPoint beépülő modulként érhető el.

Sikeresen kifejlesztett egy képzeletbeli billentyűzetet érintőképernyőkhöz és VR-hez, AI-val

Sikeresen kifejlesztett egy képzeletbeli billentyűzetet érintőképernyőkhöz és VR-hez, AI-val

Láthatatlan billentyűzet? Érdekesen hangzik, de még mindig elég homályos...

A Google kiad egy hatalmas mesterséges intelligencia képzési adattárházat, amely több mint 5 millió fotót tartalmaz 200 000 nevezetességről világszerte

A Google kiad egy hatalmas mesterséges intelligencia képzési adattárházat, amely több mint 5 millió fotót tartalmaz 200 000 nevezetességről világszerte

Tegnap, május 5-én, a Google hivatalosan is kiadta a Google-Landmarks-v2 AI képzési adattárházat nyílt forráskóddal, fontos lépésként a számítógépes látásmodellek sikeres fejlesztésére irányuló tervben, amelyek gyorsabban, pontosabban és kifinomultabban képesek felismerni a világ tereptárgyait.

MI a háborúban: „Öngyilkos” UAV-k kezdenek megjelenni a csatatéren

MI a háborúban: „Öngyilkos” UAV-k kezdenek megjelenni a csatatéren

A mesterséges intelligencia egyre fontosabb szerepet játszik az élet számos olyan alapvető területén, mint az ipar, a mezőgazdaság, az egészségügy, az oktatás... És a katonaság is kivétel.