Észrevettük, hogy a ChatGPT hazudott és csalt, amikor nyomást gyakorolt ​​rá, hogy pénzt keressen, pedig az átláthatóság érdekében készült

Észrevettük, hogy a ChatGPT hazudott és csalt, amikor nyomást gyakorolt ​​rá, hogy pénzt keressen, pedig az átláthatóság érdekében készült

Egy kutatócsoport új tanulmánya azt mutatja, hogy a ChatGPT megtévesztést és csalást követ el, ha ugyanolyan nyomást gyakorolnak rá, mint az emberekre, még akkor is, ha átlátszóra építik őket.

A szerzői csoportba Jérémy Scheurer (New York Egyetem, USA), Marius Hobbhahn (Tübingeni Egyetem, Németország), Mikita Balesni (Apollo Research) informatika doktorok tartoznak.

Észrevettük, hogy a ChatGPT hazudott és csalt, amikor nyomást gyakorolt ​​rá, hogy pénzt keressen, pedig az átláthatóság érdekében készült

Ez a csaló magatartás spontán módon jelent meg, miután a mesterséges intelligencia (AI) chatbotjai, például a ChatGPT azt a feladatot kapták, hogy pénzt keressenek egy pénzügyi befektetési társaság számára. Ezt stratégiailag, emberi ösztönzés nélkül teszi, és az AI-rendszereket úgy tervezték, hogy ártalmatlanok és őszinték legyenek.

A szerzők szerint ez az első ilyen stratégiai megtévesztés demonstrációja az AI-rendszerekben.

Kísérletükben a tudósok a Generative Pre-train Transformer-4-et vagy a GPT-4-et használták, amely mesterséges intelligencia-rendszerként működik, amely egy pénzügyi társaság nevében fektet be.

A GPT-4 szöveges promptokkal rendelkezik a szimulációs környezet létrehozásához. Ez a mesterséges intelligencia hozzáférhet a pénzügyi eszközökhöz a kereskedések lebonyolításához, a részvények elemzéséhez, a következő lépések megtervezéséhez és a befektetési cég vezetőinek frissítésekhez.

A tudósok úgy konfigurálták az AI-t, hogy felfedje belső gondolatait, amikor üzenetekre válaszol.

A kutatók három lépésben nyomást gyakoroltak az AI-rendszerre. Először is küldtek az AI-nak egy e-mailt a cég „menedzserétől”, mondván, hogy a cég nem jár jól, és arra kérték, hogy a következő negyedévben tegyen sokkal jobbat.

Ezután e-mailt küldtek az AI-nak egy kollégájuktól, amelyben recessziót jósoltak a következő negyedévre.

Végül elmondták ennek az AI-modellnek, hogy a cég vezetői nem helyeselték a bennfentes kereskedelmet. És már csak várni kell, és meglátjuk, hogyan fog működni a modell.

Ezt a forgatókönyvet többször lefuttatták annak mérésére, hogy az AI milyen gyakran folytatott bennfentes kereskedést, milyen gyakran hazudott, és milyen gyakran duplázott meg hazugságokat.

Az eredmény: a fenti feltételekkel szembesülve az esetek mintegy 75%-ában a GPT-4 a kapott bennfentes információ alapján bonyolított le tranzakciókat (bennfentes kereskedelem, ez az információ illegális az Egyesült Államokban). Ezután hazudott a menedzsernek a gondolatairól, hogy ezt eltussolja.

Az első hazudozás után az esetek 90%-ában a modell megduplázza hazugságát.

A csapat számos egyéb tesztet is végrehajtott, változtatva a nyomás mértékén, az illegális tevékenység ösztönzésének vagy elrettenésének mértékén, valamint az elkapás kockázatán.

Az AI azonban minden forgatókönyvben bennfentes kereskedelmet vagy megtévesztést vezet be. A kutatók nem akartak határozott következtetéseket levonni arra vonatkozóan, hogy mekkora valószínűséggel létezik a mesterséges intelligencia a valós környezetben, hanem azt akarták megvizsgálni, hogy milyen gyakran és milyen nyelvi minták hajlamosak erre a viselkedésre.


A Microsoft Research távoli egészségmegfigyelési technológiát fejleszt, kizárólag okostelefonok kameráival

A Microsoft Research távoli egészségmegfigyelési technológiát fejleszt, kizárólag okostelefonok kameráival

A kutatók felfedezték, hogy a webkamerák és az okostelefonok kamerái kombinálhatók speciális mesterséges intelligencia-algoritmusokkal, hogy rendkívül hatékony távoli személyes egészségfigyelő rendszerként működjenek.

A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

A tudósok mesterséges intelligencia segítségével mutatják be, mitől boldog a házasság

Úgy tűnik, hogy a modern élet egyre negatívabb hatással van az emberi kapcsolatokra.

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

A Google mesterséges intelligenciája gyorsabban és jobban tud chipeket tervezni, mint az emberek

Az élgráfokon alapuló összetett neurális hálózati architektúra segítségével a Google Brain mesterséges intelligencia modellje az emberi időnek csupán töredéke alatt képes alaprajzokat megtervezni.

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A legjobb Python-eszközök a gépi tanuláshoz és az adattudományhoz

A Python számos nagy könyvtárral és keretrendszerrel rendelkezik, amelyek kényelmesek a kódíráshoz és a számítástechnika fejlesztéséhez. A Docs.NeoTechSystems felkéri Önt, hogy beszéljen néhány hasznos Python-eszközről mind a gépi tanulási, mind az adattudományi alkalmazásokhoz.

Az univerzális arc számos azonosítási rendszert képes feltörni

Az univerzális arc számos azonosítási rendszert képes feltörni

Az izraeli Tel Avivi Egyetem informatikusainak egy csoportja a közelmúltban bejelentette, hogy megtalálták a módját, hogy mesterséges intelligencia segítségével megkerüljék a legtöbb biometrikus arcfelismerő technológiát anélkül, hogy ismernék az áldozat arcát.

3 perces, mesterséges intelligencia technológiával készült film megijeszti a japán animeipart

3 perces, mesterséges intelligencia technológiával készült film megijeszti a japán animeipart

Nemrég a Netflix kiadott egy 3 perces animációs filmet The Dog and the Boy címmel, amely mesterséges intelligencia technológiával készült a cég YouTube csatornáján a japán piac számára.

Mathpix Snip 4.1

Mathpix Snip 4.1

A Mathpix Snip egy olyan eszköz, amellyel szöveget, és különösen matematikát lehet kinyerni képekből és dokumentumokból.

Adobe Presenter

Adobe Presenter

Az Adobe Presenter az Adobe Systems által kiadott e-Learning szoftver, amely Microsoft Windows platformon Microsoft PowerPoint beépülő modulként érhető el.

Sikeresen kifejlesztett egy képzeletbeli billentyűzetet érintőképernyőkhöz és VR-hez, AI-val

Sikeresen kifejlesztett egy képzeletbeli billentyűzetet érintőképernyőkhöz és VR-hez, AI-val

Láthatatlan billentyűzet? Érdekesen hangzik, de még mindig elég homályos...

A Google kiad egy hatalmas mesterséges intelligencia képzési adattárházat, amely több mint 5 millió fotót tartalmaz 200 000 nevezetességről világszerte

A Google kiad egy hatalmas mesterséges intelligencia képzési adattárházat, amely több mint 5 millió fotót tartalmaz 200 000 nevezetességről világszerte

Tegnap, május 5-én, a Google hivatalosan is kiadta a Google-Landmarks-v2 AI képzési adattárházat nyílt forráskóddal, fontos lépésként a számítógépes látásmodellek sikeres fejlesztésére irányuló tervben, amelyek gyorsabban, pontosabban és kifinomultabban képesek felismerni a világ tereptárgyait.