V nedávnej štúdii vykonanej v spoločnosti Google sa inžinieri pokúsili použiť model umelej inteligencie (AI) ako základ na vytvorenie 4-nohého robota, ktorý sa dokáže naučiť, ako sa pohybovať extrémne prirodzene, bez toho, aby potreboval príliš veľa pomoci od ľudí, ako je pohyb vpred, dozadu, otáčanie doľava a doprava. Okrem toho sa môže naučiť, ako sa presne pohybovať na troch rôznych typoch terénu, vrátane rovnej pôdy, mäkkých vankúšov a rohožiek s medzerami.
Môže to znieť jednoducho, ale v skutočnosti je veľmi ťažké navrhnúť ovládače robotov, ktoré dokážu zvládnuť také rozmanité a zložité navigačné príkazy, najmä na rôznych typoch terénu, bez pomoci AI. Kľúčovým problémom je, že roboty sa dokážu samy učiť a prispôsobiť sa mnohým situáciám, namiesto toho, aby vždy potrebovali ľudský zásah na každom kroku.
Technológia AI použitá v tomto projekte sa nazýva „učenie s hlbokým posilňovaním“, prístup založený na technológii hlbokého učenia inšpirovaného psychológiou učenia. en a „učenie pokusom“ a „učenie omylom“. Sila učenia sa hlbokého posilnenia bola prvýkrát preukázaná v roku 2013, keď DeepMind vydal model AI, ktorý sa mohol naučiť hrať klasické hry Atari bez akýchkoľvek pokynov.
Videohry, alebo aspoň simulačné hry, tiež často používajú výskumníci v oblasti robotiky na trénovanie svojich modelov AI. Vytvára skvelé teoretické prostredie, ktoré umožňuje výskumníkom trénovať svoje roboty vo virtuálnom svete predtým, ako sa vydajú do skutočného sveta, a pomáha robotom rozpoznať a zapamätať si situácie, ktoré zažíva, keď sa učia vykonávať konkrétnu úlohu.
Okrem toho výskumníci Google tiež podporujú vývoj vylepšených algoritmov, ktoré umožňujú ich robotom učiť sa rýchlejšie s menším počtom pokusov.
Skutočnosť, že robot sa dokáže naučiť chodiť sám za 2 hodiny nemusí byť šokujúcim výsledkom, ale ukazuje jasný rozdiel v efektivite v porovnaní s inžiniermi, ktorí musia špecificky naprogramovať každú operáciu. Spôsob, akým roboty fungujú, je manuálny a extrémne pasívny ako predtým. Obrovské však boli aj ťažkosti, s ktorými sa tím Google stretol.
„Aj keď v simulácii bolo demonštrovaných mnoho algoritmov učenia bez dozoru alebo hlbokého posilnenia, ich aplikácia na roboty v experimentoch v reálnom svete nie je jednoduchá. Po prvé, učenie s hlbokým posilňovaním vyžaduje veľké množstvo vstupných tréningových údajov a zhromažďovanie údajov o robotoch je tiež veľmi nákladné. Po druhé, tréningový proces si vyžaduje veľa času na sledovanie robota. Ak by sme potrebovali človeka, ktorý by robota monitoroval a ručne ho resetoval vždy, keď sa zakopol – stovky či tisíckrát –, zaškolenie robota by si vyžadovalo veľa úsilia a času. Čím dlhšie to bude trvať, tým ťažšie bude škálovať učenie pre roboty v mnohých rôznych prostrediach,“ povedal Jie Tan, jeden z kľúčových inžinierov projektu.
V budúcnosti by tento výskum mohol pomôcť vytvoriť agilnejšie roboty, ktoré sa dokážu rýchlejšie prispôsobiť rôznym typom terénu. Aplikačný potenciál je obrovský, avšak projekt je len v počiatočných fázach vývoja a bude ešte veľa výziev, ktoré treba prekonať.