A DeepMind Technologies, az Alphabet mesterséges intelligencia leányvállalata – amely évek óta az AI-kutatásra szakosodott – új mesterséges intelligencia platformot indított AlphaZero néven. Ez a mesterséges intelligencia mély neurális hálózatokat használ fel, hogy emberi beavatkozás nélkül gyorsan megtanuljon go, sakkozni és Shogit játszani.
Az AlphaZero a világ legjobb mesterséges intelligenciájával mérkőzött meg a fenti társasjátékokban, többek között:
- Stockfish: AI világbajnok sakkban.
- Elmo: A 27. Computer Shogi Világbajnokság bajnoka 2017-ben.
- AlphaGo Zero: Az AI a történelem legerősebb Go-játékosa, maga a Deep Mind hozta létre.
Az AlphaZero mindhárom versenyszámban csak a játékszabályok alapismeretét kapta. Aztán magától tanult, több millió meccset lejátszva. Kezdetben az AlphaZero csak sok véletlenszerű stratégiát próbált ki a győzelem érdekében, majd a „megerősítő tanulásnak” nevezett próba- és hibafolyamat során fokozatosan megtanulta, hogy mely stratégiák a leghatékonyabbak.
A tanulásban és a képzésben az AlphaZero 5000 tenzoros feldolgozó egységet használ (TPU – egyetlen egység több mint 100 millió fényképet képes feldolgozni a Google Fotókban naponta) 9 órán keresztül sakknál, 12 órán keresztül Shoginál és 13 napig a Gonál.
A tanulási folyamat befejezése után az AlphaZero versenyezhet más ellenfelekkel. És természetesen az AlphaZero gyorsan kiiktatta ellenfeleit, és a történelem legerősebb versenyzőjévé vált.
A DeepMind csapata felszerelte az AlphaZero-t egy olyan rendszerrel, amely egyesíti a tanulási algoritmusokat és a „Monte Carlo tree search” (MCTS) módszert, amely segít a go-playing MI-nek eldönteni, melyik lépést tegye meg a következő lépésben, hogy megtanuljon sakkozni és Shogit. Az eredmények azt mutatják, hogy az MCTS más összetett játékokhoz is adaptálható.
Érdekesség, hogy az AlphaZero-nak nincs szüksége emberi irányításra, önállóan kutat stratégiákat, és olyan ötletekkel áll elő, amilyeneket az emberek még nem láttak. Az AlphaZero agresszív játékstílusa és nagyfokú rugalmassága még a nagyszerű sakkozót, Matthew Sadlert is meglepte.
Egyedülálló stratégiáival és képességeivel az AlphaZero kiváló sakktanító eszközzé válik, amely példátlan taktikai játékmenet létrehozására ösztönzi azokat, akik sakkozni szeretnének.
Többet látni: