Az Nvidia, a Torontói Egyetem és a torontói Vector Institute of Artificial Intelligence számítástechnikai kutatói olyan módszert dolgoztak ki, amellyel pontosabban észlelhetik és megjósolhatják egy objektum kezdetét és végét. Ez a fajta tudás segíthet a jelenlegi számítógépes látásmodellek következtetéseinek javításában, ugyanakkor támogatja a képzési adatok címkézését a jövőbeli modellekhez.
A kutatócsoport kísérletsorozata során a tudósok arra a következtetésre jutottak, hogy a mesterséges intelligencia modellje, a Semantically Thinned Edge Alignment Learning (STEAL) segíthet javítani a „szemantikus határvonal” előrejelzési modell pontosságát.” A modern CASENet 4%-kal nőtt. Az objektumok határainak és éleinek pontosabb azonosításának képessége gyakorlati alkalmazásokat jelenthet számítógépes látási feladatokhoz, a képalkotástól a 3D térrekonstrukcióig.
Szemantikusan vékonyított éligazítás tanulása (STEAL)
A STEAL alkalmazható a meglévő CNN-ek vagy objektumél-észlelési modellek javítására, de a kutatók úgy vélik, hogy segíthet az adatok hatékonyabb címkézésében vagy megjegyzéseiben is. Ennek bizonyítására a tudósok a STEAL módszert használták a városképek finomításához – a városi környezethez kapcsolódó tartalommal rendelkező adathalmazt –, amelyet először a Machine Vision konferencián mutattak be. Computer Vision and Pattern Recognition (CVPR) 2016-ban.
Jelenleg a GitHubon a STEAL keretrendszer viszonylag pontosan képes megtanulni és megjósolni egy objektum minden sarkát pixelben egy olyan módszerrel, amelyet a kutatók "aktív igazításnak" neveznek. Az edzés közbeni annotációs zajról szóló explicit érvelés és a neurális hálózatok szintbeállító képletei a torzított címkereprezentációkból végpontokig tanulva szintén segítenek az eredmények elérésében.
Az objektum határainak és éleinek pontosabb azonosítása
"Továbbá megmutatjuk, hogy előrejelzési határaink jobban teljesítenek, mint a legújabb DeepLab-v3 szegmens kimenetei, miközben csak az architektúra sokkal könnyebb" - mondta a kutatócsoport képviselője az arXiv híroldalnak adott mélyinterjúban.
Ennek a kutatási munkának a címe: „Az ördög a széleken: Szemantikai határok tanulása zajos megjegyzésekből”, és a kaliforniai Long Beach-ben megrendezésre kerülő CVPR 2019 konferencia keretében egy előadáson keresztül széles körben bemutatják. Az Nvidia Research szakértői jelentősen hozzájárultak ehhez a kutatáshoz, akik az idei CVPR-n személyes szemszögből is bemutatják a kutatást.
Az újonnan jelentett hírek szerint az Nvidia bejelentette, hogy 2020-ban támogatni fogja a brit Arm brit gyártó nagy teljesítményű számítástechnikai hardverrendszereit, valamint a Githubon a nyílt forráskódú TensorRT értelmező következtetési szoftvert, hogy lehetővé tegye a nagyobb testreszabhatóságot.