Az amerikai Allen Mesterséges Intelligencia Intézet kutatói új AI2-t készítettek, amely képes leíró szöveget tartalmazó fényképeket generálni. Ezt az AI-t egy számítógépes látásmodell alapján hozták létre, amely megjegyzésekkel látja el azt, amit a fényképen "lát", de megfordítja az algoritmust, hogy a leírásból képet hozzon létre. Bár az AI által készített képek kissé "ijesztőek", új lépést jelentenek a mesterséges intelligencia terén.
Az MIT Technology Review szerint a leírásokból képek generálása izgalmas kutatási terület. A fényképek szöveges leírása még a gyerekek számára is meglehetősen egyszerű, de ennek a fordítottja sem egyszerű.
Az AI2 készítette "az úton sétáló zebráról, miközben két autó rohan el mellette".
Az Allen Institute kutatói létrehoztak egy Lxmert nevű képannotációs modellt, majd frissítették X-Lxmertre. Bár a fotón láthatóakat az Lxmert nem írja le pontosan és "koherensen", a fotótartalom nem teljesen "értelmetlen".
A kutatók ezután arra kérték az MI-t, hogy készítsen fotót ezekből a leírásokból. Bár szinte egyik fotó sem készült el, az eredmények lenyűgözték a kutatókat. Ez a mesterséges intelligencia bizonyos kulcsszavakra, például „fotós”, „fotóstúdió” vagy „kamera” nem kínál tökéletes terméket, de még mindig hihetetlen előrelépés az intelligencia területén. mesterséges, ami azt mutatja, hogy a hiányosságok megmaradtak A mesterséges intelligencia ipar „megtölti” a jövőben.
Befejezetlen „kamera az asztalon” képe az AI2-ről.
Ezenkívül ez az irány megnyithatja a mesterséges intelligencia hatalmas potenciálját, ha a film- és festészetben használják.