Az AI-modell légi és földi adatok segítségével navigál a nehezen megfigyelhető területekre

Az AI-modell légi és földi adatok segítségével navigál a nehezen megfigyelhető területekre

Segíthetnek-e a mesterséges intelligencia modellek eligazodni olyan területeken (utcákon), amelyeken korábban soha nem képezték ki őket, vagy amelyekre nem kaptak elegendő képzési adatot? Ez az, ami miatt a DeepMind mesterséges intelligencia fejlesztőcsapatának tudósai aggódnak. Sok év inkubáció után a tudósok végre sikereket értek el a „Cross-View Policy Learning for Street Navigation” nevű kutatási projektben, amely nemrég derült ki az Arxiv.org oldalon megjelent cikkből.

Ebben a kutatásban a DeepMind tudósai egy olyan mesterséges intelligencia-politika kialakítását írják le, amelyet egy gazdag adattárházból képeztek ki sok szögből (többnyire felülről lefelé készült képek), amely a város különböző területeit célozza meg az optimálisabb megfigyelési hatékonyság érdekében. A kutatók úgy vélik, hogy egy ilyen megközelítés jobb általánosítási eredményekhez vezetne.

Az AI-modell légi és földi adatok segítségével navigál a nehezen megfigyelhető területekre

Ezt a kutatást lényegében az a tény ihlette, hogy az emberek gyorsan tudnak alkalmazkodni egy új város elrendezéséhez és alapszerkezetéhez, ha sokszor gondosan megvizsgálják az adott város térképét.

„Az ismeretlen környezetben végzett vizuális megfigyelések alapján történő navigálás alapvető eleme az AI-modellek navigációs tanulási képességének tanulmányozásának. A mesterséges intelligencia modellek útbaigazítási képessége olyan esetekben, amikor hiányoznak a képzési adatok, eddig viszonylag korlátozott volt, és a szimulációs modellekre hagyatkozni nem lehet hosszú távon hatékony megoldás. Alapelvünk az, hogy a földi nézetet párosítsuk a légi képpel, és feltárjuk a közös irányelveket, amelyek lehetővé teszik a nézetek közötti váltást” – mondta a kutatócsoport egyik képviselője.

Pontosabban, az első lépés, amelyet a kutatóknak meg kell tenniük, az, hogy légi térképeket gyűjtsenek az általuk navigálni kívánt területről (földrajzi koordinátákon alapuló utcai megfigyelési módokkal kombinálva). ennek megfelelő ok). Ezt követően három részből álló teleportációs küldetésbe kezdtek, kezdve az adatok kiképzésével és a forrásterület légi megfigyelések segítségével történő beállításával, és a célterületre való mozgással, földi megfigyelések segítségével.

A kutatócsoport gépi tanulási rendszere 3 különálló modulból áll, köztük:

  • Konvolúciós modul, a vizuális észlelésért felelős.
  • A hosszú rövid távú memória (LSTM) modul felelős a helyspecifikus jellemzők lekéréséért.
  • A politika ismétlődő neurális modulja akciókon keresztül segít felosztást létrehozni.

Ezt a gépi tanulási modellt a StreetAirben vezették be – egy több perspektívát átfogó szabadtéri utcai környezetben –, amely a StreetLearn tetejére épült. (A StreetLearn az első interaktív panorámafotók gyűjteménye a Google Street View-ból és a Google Térképből).

Az AI-modell légi és földi adatok segítségével navigál a nehezen megfigyelhető területekre

A StreetAir és a StreetLearn alkalmazásban a New York Cityre (beleértve New York Downtown és Midtown NYC) és Pittsburghre (az Allegheny College és a Carnegie Mellon Egyetem kampuszai) panorámás kilátást nyújtó légifelvételek úgy vannak elrendezve, hogy minden szélességi és hosszúsági koordináta fokon és hosszúságon a környezet légi képet adjon. 84 x 84 méretű képek, amelyek megegyeznek a földről készült képekkel.

A mesterséges intelligencia rendszernek a betanítás után az lesz a feladata, hogy megtanulja lokalizálni és navigálni a panoráma Utcakép képdiagramon a cél hosszúsági és szélességi koordinátáival.

A panorámák oldalirányban 2-5 km-es, egymástól kb. 10 m-re lévő területeket fednek le, és az (AI által vezérelt) járművek kanyarodásonként 5 műveletből egyet hajthatnak végre: előre , balra vagy jobbra fordulás 22,5 fokkal vagy balra vagy jobbra 67,5 fokon.

Amikor 100-200 méteren belül megközelítik a célhelyet, ezek a járművek „jutalmakat” kapnak, amelyek ösztönzik a kereszteződések gyors és pontos azonosítását és áthaladását.

Az AI-modell légi és földi adatok segítségével navigál a nehezen megfigyelhető területekre

Kísérletek során azok a járművek, amelyek légi felvételeket használva alkalmazkodtak az új környezetekhez, 100 millió lépésnél 190-es, 200 millió lépésnél 280-as jutalommutatót értek el, mindkettő lényegesen magasabb, mint a csak földi megfigyelési adatokat használó járművek (50 100 millió lépésnél és 200 200 lépésnél). millió lépés). A kutatók szerint az eredmények azt mutatták, hogy módszerük jelentősen javítja a járművek azon képességét, hogy hatékonyabban szerezzenek ismereteket a célváros több területéről.


Az AI-alapú rendszert az orvvadászok észlelésére tervezték

Az AI-alapú rendszert az orvvadászok észlelésére tervezték

A vadászok gyakran éjszaka vadásznak, ezért észlelésükre drónokra szerelt infravörös kamerákat használnak. A probléma az, hogy mivel az orvvadász és az állat is hőt bocsát ki, nehéz lehet pontosan azonosítani őket.

5 ingyenes AI chatbot az Ön webhelyéhez

5 ingyenes AI chatbot az Ön webhelyéhez

Képzelje el, hogy alvás közben is válaszol az ügyfelek kérdéseire. Íme, mit tehetnek az ingyenes mesterséges intelligencia chatbotok az Ön webhelyén.

Csaposok, figyelem: Ez a robot mindössze 1 perc alatt képes összekeverni egy koktélt

Csaposok, figyelem: Ez a robot mindössze 1 perc alatt képes összekeverni egy koktélt

Japán elöregedő és csökkenő népessége miatt az országból jelentős számú fiatal munkaerő hiányzik, különösen a szolgáltatási szektorban.

A Character.AI finanszírozást keres, hogy a cég értékét több mint 5 milliárd dollárra emelje

A Character.AI finanszírozást keres, hogy a cég értékét több mint 5 milliárd dollárra emelje

A Character.AI, a Generatív mesterséges intelligencia és a chatbot technológiára összpontosító startup állítólag tárgyalásokat folytat olyan finanszírozás megszerzéséről, amely több mint 5 milliárd dollár értékben érheti el a céget.

A mesterséges intelligencia segít tisztázni egy híres, közel 400 éves színdarab szerzőjével kapcsolatos vitát

A mesterséges intelligencia segít tisztázni egy híres, közel 400 éves színdarab szerzőjével kapcsolatos vitát

A VIII. Henrik az angol irodalom történetének egyik legklasszikusabb darabja, amelyet két híres szerző, William Shakespeare és John Fletcher írt 1623-ban.

Telepítse az AI-t mikrohullámú sütőre, hogy képzeletbeli barátja valóra váljon, de ami létrejön, az egy gyilkos gép

Telepítse az AI-t mikrohullámú sütőre, hogy képzeletbeli barátja valóra váljon, de ami létrejön, az egy gyilkos gép

Egy YouTuber és egy brazíliai mérnök, Lucas Rizzotto a közelmúltban megosztotta a Twitteren azt a történetet, hogy megvalósította képzeletbeli barátját – egy mikrohullámú sütőt a házban, aki mesterséges intelligenciát használ, de élete "egyik legfélelmetesebb élményét" kapta.

A Microsoft Research távoli egészségmegfigyelési technológiát fejleszt, kizárólag okostelefonok kameráival

A Microsoft Research távoli egészségmegfigyelési technológiát fejleszt, kizárólag okostelefonok kameráival

A kutatók felfedezték, hogy a webkamerák és az okostelefonok kamerái kombinálhatók speciális mesterséges intelligencia-algoritmusokkal, hogy rendkívül hatékony távoli személyes egészségfigyelő rendszerként működjenek.

A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

Úgy tűnik, hogy a modern élet egyre negatívabb hatással van az emberi kapcsolatokra.

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

Az élgráfokon alapuló összetett neurális hálózati architektúra segítségével a Google Brain mesterséges intelligencia modellje az emberi időnek csupán töredéke alatt képes alaprajzokat megtervezni.

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A Python számos nagy könyvtárral és keretrendszerrel rendelkezik, amelyek kényelmesek a kódíráshoz és a számítástechnika fejlesztéséhez. A Docs.NeoTechSystems felkéri Önt, hogy beszéljen néhány hasznos Python-eszközről mind a gépi tanulási, mind az adattudományi alkalmazásokhoz.