Počítačoví vedci z Nvidie, University of Toronto a Vector Institute of Artificial Intelligence v Toronte vymysleli spôsob, ako presnejšie odhaliť a predpovedať, kde sa objekt začína a končí. Tento druh vedomostí môže pomôcť zlepšiť odvodenie súčasných modelov počítačového videnia a zároveň podporiť označovanie tréningových údajov pre budúce modely.
V sérii experimentov výskumného tímu vedci zistili, že model umelej inteligencie Semanically Thinned Edge Alignment Learning (STEAL) môže pomôcť zlepšiť presnosť predikčného modelu „sémantických hraníc“. Schopnosť presnejšie identifikovať hranice a okraje objektu by mohla mať praktické využitie pri úlohách počítačového videnia, od generovania obrazu až po rekonštrukciu 3D priestoru na detekciu objektov.
Učenie sémanticky tenkých okrajov (STEAL)
STEAL možno použiť na zlepšenie existujúcich CNN alebo modelov detekcie okrajov objektov, ale výskumníci sa tiež domnievajú, že im to môže tiež pomôcť efektívnejšie označovať alebo anotovať údaje. Modely počítačového videnia. Aby to dokázali, vedci použili metódu STEAL na spresnenie Cityscapes – súbor údajov s obsahom súvisiacim s mestským prostredím – predstavený po prvýkrát na konferencii Machine Vision Computer Vision and Pattern Recognition (CVPR) v roku 2016.
V súčasnosti na GitHub sa framework STEAL dokáže naučiť a predpovedať každý roh objektu v pixeloch pomerne presne pomocou metódy, ktorú výskumníci nazývajú „aktívne zarovnanie“. Explicitné uvažovanie o šume anotácií počas tréningu a vzorce pre nastavenie úrovne pre neurónové siete pri učení sa zo skreslených reprezentácií štítkov komplexným spôsobom tiež pomáhajú dosiahnuť výsledky.
Schopnosť presnejšie identifikovať hranice a okraje objektu
"Ďalej ukazujeme, že naše predikčné hranice prevyšujú hranice získané z najnovších výstupov segmentu DeepLab-v3, pričom používame iba architektúru je oveľa ľahšia," povedal zástupca výskumného tímu v hĺbkovom rozhovore pre spravodajskú stránku arXiv.
Táto výskumná práca má názov: „Diabol je na hranách: Učenie sa sémantických hraníc z hlučných anotácií“ a bude široko predstavená prostredníctvom prezentácie v rámci konferencie CVPR 2019, ktorá sa koná v Long Beach v Kalifornii. K tomuto výskumu výrazne prispeli odborníci z Nvidia Research, ktorí na tohtoročnom CVPR aj konkrétne predstavia výskum z osobnej perspektívy.
Podľa novo hlásených správ Nvidia uviedla, že v roku 2020 bude podporovať vysokovýkonné výpočtové hardvérové systémy od britského výrobcu Arm a open source softvér na analýzu inferencie TensorRT na Github , aby sa umožnilo väčšie prispôsobenie.