A Microsoft nemrég jelentette be hivatalosan a mesterséges intelligencián (AI) alapuló képfeliratozási (leírási) technológia bevezetését az Azure Cognitive Services szolgáltatási platformon keresztül. Nevezetesen, a redmondi cég képviselője magabiztosan megerősítette, hogy ez a mesterséges intelligencia-rendszer jelenleg nem rosszabb, mint az embernél pontosabban képes leírni a képeket, bizonyos esetekben még pontosabban, és természetesen sokkal nagyobb termelékenységgel.
Ez az új technológia azt ígéri, hogy hatékony asszisztenssé válik, segítve a fejlesztőket a kisegítő lehetőségek és a felhasználói élmény javításában saját alkalmazáskörnyezetükben. Az AI-alapú képannotációval a felhasználók gyorsan azonosíthatják a képek fontos tartalmát, például a keresési eredmények tartalmát és a prezentációk fotóit a kommentárok segítségével. A mesterséges intelligencia által generált gyors tetszésnyilvánítások sok idő nélkül. A Microsoft azonban arra is figyelmeztet, hogy az AI által biztosított megjegyzések nem mindig tökéletesek, és idővel fokozatosan javítani kell.
Ennél is fontosabb, hogy Saqib Shaikh, a Microsoft mesterséges intelligencia platformok csoportjának szoftverfejlesztési igazgatója szerint a képaláírás jelentősen segítheti a látássérült embereket azáltal, hogy egy weboldalon vagy dokumentumban fotóleírásokat, amelyeket általában asalt szövegnek neveznek, készít. Ezenkívül Shaikh csapata a Seeing AI kamerarendszert is használja a vakok vagy gyengénlátó emberek képeinek leírására.
„Az AI-rendszer fejlesztése során az a gondolatunk, hogy a lehető legpontosabb leírást adjuk minden olyan képhez, amely a dokumentumokban, a weben vagy a közösségi média felületein jelenik meg... Ezáltal lehetővé válik a látássérültek számára, hogy könnyen megragadják a fényképes tartalmat, és online részt vegyenek magabiztosabb kommunikációt."
Az automatikus fotóannotációs rendszert bemutató videó:
Mint a Microsoft feltárta, ez az új rendszer mind a pontosság, mind a termelékenység tekintetében kétszer olyan hatékony, mint a 2015 óta használt régi képannotációs modell.
Az év későbbi szakaszában ez a mesterséges intelligencia által vezérelt képaláírási technológia a Microsoft Word és az Outlook for Windows és Mac platformokba , valamint a Windows, Mac és a webes PowerPointba is beépül.