A Microsoft bemutat egy mesterséges intelligencia-rendszert, amely pontosabban képes leírni a képeket, mint az emberek

A Microsoft nemrég jelentette be hivatalosan a mesterséges intelligencián (AI) alapuló képfeliratozási (leírási) technológia bevezetését az Azure Cognitive Services szolgáltatási platformon keresztül. Nevezetesen, a redmondi cég képviselője magabiztosan megerősítette, hogy ez a mesterséges intelligencia-rendszer jelenleg nem rosszabb, mint az embernél pontosabban képes leírni a képeket, bizonyos esetekben még pontosabban, és természetesen sokkal nagyobb termelékenységgel.

Ez az új technológia azt ígéri, hogy hatékony asszisztenssé válik, segítve a fejlesztőket a kisegítő lehetőségek és a felhasználói élmény javításában saját alkalmazáskörnyezetükben. Az AI-alapú képannotációval a felhasználók gyorsan azonosíthatják a képek fontos tartalmát, például a keresési eredmények tartalmát és a prezentációk fotóit a kommentárok segítségével. A mesterséges intelligencia által generált gyors tetszésnyilvánítások sok idő nélkül. A Microsoft azonban arra is figyelmeztet, hogy az AI által biztosított megjegyzések nem mindig tökéletesek, és idővel fokozatosan javítani kell.

Ennél is fontosabb, hogy Saqib Shaikh, a Microsoft mesterséges intelligencia platformok csoportjának szoftverfejlesztési igazgatója szerint a képaláírás jelentősen segítheti a látássérült embereket azáltal, hogy egy weboldalon vagy dokumentumban fotóleírásokat, amelyeket általában asalt szövegnek neveznek, készít. Ezenkívül Shaikh csapata a Seeing AI kamerarendszert is használja a vakok vagy gyengénlátó emberek képeinek leírására.

„Az AI-rendszer fejlesztése során az a gondolatunk, hogy a lehető legpontosabb leírást adjuk minden olyan képhez, amely a dokumentumokban, a weben vagy a közösségi média felületein jelenik meg... Ezáltal lehetővé válik a látássérültek számára, hogy könnyen megragadják a fényképes tartalmat, és online részt vegyenek magabiztosabb kommunikációt."

Az automatikus fotóannotációs rendszert bemutató videó:

Mint a Microsoft feltárta, ez az új rendszer mind a pontosság, mind a termelékenység tekintetében kétszer olyan hatékony, mint a 2015 óta használt régi képannotációs modell.

Az év későbbi szakaszában ez a mesterséges intelligencia által vezérelt képaláírási technológia a Microsoft Word és az Outlook for Windows és Mac platformokba , valamint a Windows, Mac és a webes PowerPointba is beépül.


A Microsoft Research távoli egészségmegfigyelési technológiát fejleszt, kizárólag okostelefonok kameráival

A Microsoft Research távoli egészségmegfigyelési technológiát fejleszt, kizárólag okostelefonok kameráival

A kutatók felfedezték, hogy a webkamerák és az okostelefonok kamerái kombinálhatók speciális mesterséges intelligencia-algoritmusokkal, hogy rendkívül hatékony távoli személyes egészségfigyelő rendszerként működjenek.

A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

Úgy tűnik, hogy a modern élet egyre negatívabb hatással van az emberi kapcsolatokra.

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

Az élgráfokon alapuló összetett neurális hálózati architektúra segítségével a Google Brain mesterséges intelligencia modellje az emberi időnek csupán töredéke alatt képes alaprajzokat megtervezni.

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A Python számos nagy könyvtárral és keretrendszerrel rendelkezik, amelyek kényelmesek a kódíráshoz és a számítástechnika fejlesztéséhez. A Docs.NeoTechSystems felkéri Önt, hogy beszéljen néhány hasznos Python-eszközről mind a gépi tanulási, mind az adattudományi alkalmazásokhoz.

Az univerzális arc számos azonosítási rendszert képes feltörni

Az univerzális arc számos azonosítási rendszert képes feltörni

Az izraeli Tel Avivi Egyetem informatikusainak egy csoportja a közelmúltban bejelentette, hogy megtalálták a módját, hogy mesterséges intelligencia segítségével megkerüljék a legtöbb biometrikus arcfelismerő technológiát anélkül, hogy ismernék az áldozat arcát.

3 perces, mesterséges intelligencia technológiával készült film megijeszti a japán animeipart

3 perces, mesterséges intelligencia technológiával készült film megijeszti a japán animeipart

Nemrég a Netflix kiadott egy 3 perces animációs filmet The Dog and the Boy címmel, amely mesterséges intelligencia technológiával készült a cég YouTube csatornáján a japán piac számára.

Mathpix Snip 4.1

Mathpix Snip 4.1

A Mathpix Snip egy olyan eszköz, amellyel szöveget, és különösen matematikát lehet kinyerni képekből és dokumentumokból.

Adobe Presenter

Adobe Presenter

Az Adobe Presenter az Adobe Systems által kiadott e-Learning szoftver, amely Microsoft Windows platformon Microsoft PowerPoint beépülő modulként érhető el.

Sikeresen kifejlesztett egy képzeletbeli billentyűzetet érintőképernyőkhöz és VR-hez, AI-val

Sikeresen kifejlesztett egy képzeletbeli billentyűzetet érintőképernyőkhöz és VR-hez, AI-val

Láthatatlan billentyűzet? Érdekesen hangzik, de még mindig elég homályos...

A Google kiad egy hatalmas mesterséges intelligencia képzési adattárházat, amely több mint 5 millió fotót tartalmaz 200 000 nevezetességről világszerte

A Google kiad egy hatalmas mesterséges intelligencia képzési adattárházat, amely több mint 5 millió fotót tartalmaz 200 000 nevezetességről világszerte

Tegnap, május 5-én, a Google hivatalosan is kiadta a Google-Landmarks-v2 AI képzési adattárházat nyílt forráskóddal, fontos lépésként a számítógépes látásmodellek sikeres fejlesztésére irányuló tervben, amelyek gyorsabban, pontosabban és kifinomultabban képesek felismerni a világ tereptárgyait.