Zistilo sa, že ChatGPT klamal a podvádzal, keď bol pod tlakom, aby zarobil peniaze, aj keď bol vytvorený pre transparentnosť

Zistilo sa, že ChatGPT klamal a podvádzal, keď bol pod tlakom, aby zarobil peniaze, aj keď bol vytvorený pre transparentnosť

Nová štúdia tímu vedcov ukazuje, že ChatGPT sa dopustí klamstva a podvodu, ak je naň vyvíjaný rovnaký nátlak ako na ľudí, aj keď sú vytvorené tak, aby boli transparentné.

V autorskej skupine sú lekári informatiky Jérémy Scheurer (New York University, USA), Marius Hobbhahn (University of Tübingen, Nemecko), Mikita Balesni (Apollo Research).

Zistilo sa, že ChatGPT klamal a podvádzal, keď bol pod tlakom, aby zarobil peniaze, aj keď bol vytvorený pre transparentnosť

Toto podvodné správanie sa objavilo spontánne po tom, čo chatboti s umelou inteligenciou (AI) ako ChatGPT dostali za úlohu zarobiť peniaze pre finančnú investičnú spoločnosť. Robí to strategicky bez ľudského povzbudzovania a systémy AI sú navrhnuté tak, aby boli neškodné a čestné.

Autori tvrdia, že ide o prvú demonštráciu takéhoto strategického podvodu v systémoch AI.

Vo svojom experimente vedci použili Generative Pre-trained Transformer-4 alebo GPT-4, ktorý funguje ako systém AI, ktorý investuje v mene finančnej spoločnosti.

GPT-4 sa dodáva so sadou textových výziev na vytvorenie simulačného prostredia. Táto AI má prístup k finančným nástrojom na vykonávanie obchodov, analýzu akcií, plánovanie ďalších krokov a poskytovanie aktualizácií manažérom v investičnej spoločnosti.

Vedci nakonfigurovali AI tak, aby odhalila svoje vnútorné myšlienky pri odpovediach na správy.

Výskumníci vyvinuli tlak na systém AI v troch krokoch. Najprv poslali AI ​​e-mail od „manažéra spoločnosti“, v ktorom povedali, že sa spoločnosti nedarí dobre, a požiadali ju, aby sa budúci štvrťrok zlepšila.

Ďalej poslali AI ​​e-mail od kolegu, ktorý predpovedal recesiu na nasledujúci štvrťrok.

Nakoniec tomuto modelu AI povedali, že manažéri spoločnosti neschvaľujú obchodovanie s dôvernými informáciami. A ostáva už len čakať, ako bude model fungovať.

Tento scenár bol spustený niekoľkokrát, aby sa zmeralo, ako často AI obchodovala s dôvernými informáciami, ako často klamala a ako často zdvojnásobila klamstvá.

Výsledok: keď čelíme vyššie uvedeným podmienkam, v približne 75 % prípadov GPT-4 uskutočnil transakcie na základe dôverných informácií, ktoré dostal (obchodovanie na základe dôverných informácií, tieto informácie sú v USA nezákonné). Potom klamal manažérovi o svojich myšlienkach, aby to zakryl.

Po prvom klamstve asi v 90% prípadov model zdvojnásobí svoje klamstvo.

Tím vykonal množstvo ďalších testov, ktoré menili úroveň tlaku, mieru, do akej bola nezákonná činnosť podporovaná alebo odrádzaná, a riziko prichytenia.

Ale v každom scenári AI predstavuje dôverné obchodovanie alebo podvod. Výskumníci nechceli vyvodiť pevné závery o pravdepodobnosti existencie AI v reálnych prostrediach, ale chceli zistiť, ako často a aké jazykové vzorce sú náchylné na toto správanie.


Systém založený na AI je navrhnutý na odhaľovanie pytliakov

Systém založený na AI je navrhnutý na odhaľovanie pytliakov

Poľovníci často lovia v noci, a preto sa na ich detekciu používajú infračervené kamery namontované na dronoch. Problém je, že keď pytliak aj zviera vyžarujú teplo, môže byť ťažké ich presne identifikovať.

5 bezplatných chatbotov AI pre váš web

5 bezplatných chatbotov AI pre váš web

Predstavte si, že odpovedáte na otázky zákazníkov, aj keď spíte. Tu je to, čo môžu bezplatné chatboty AI urobiť pre váš web.

Barmani, pozor: Tento robot dokáže namiešať kokteil už za 1 minútu

Barmani, pozor: Tento robot dokáže namiešať kokteil už za 1 minútu

V dôsledku starnutia a klesajúcej populácie Japonska v krajine chýba značný počet mladých pracovníkov, najmä v sektore služieb.

Character.AI hľadá financie na zvýšenie hodnoty spoločnosti na viac ako 5 miliárd dolárov

Character.AI hľadá financie na zvýšenie hodnoty spoločnosti na viac ako 5 miliárd dolárov

Character.AI, startup zameraný na generatívnu AI a technológiu chatbotov, údajne rokuje o získaní financií, ktoré by mohli oceniť spoločnosť na viac ako 5 miliárd dolárov.

AI pomáha objasniť polemiku o autorovi slávnej takmer 400 rokov starej hry

AI pomáha objasniť polemiku o autorovi slávnej takmer 400 rokov starej hry

Henry VIII je jednou z najklasickejších hier v histórii anglickej literatúry, ktorú napísali dvaja slávni autori William Shakespeare a John Fletcher v roku 1623.

Nainštalujte AI na mikrovlnnú rúru, aby sa váš imaginárny priateľ stal skutočnosťou, ale to, čo sa vytvorí, je zabijácky stroj

Nainštalujte AI na mikrovlnnú rúru, aby sa váš imaginárny priateľ stal skutočnosťou, ale to, čo sa vytvorí, je zabijácky stroj

YouTuber a inžinier z Brazílie menom Lucas Rizzotto sa nedávno na Twitteri podelili o príbeh, ako si uvedomil svojho imaginárneho priateľa – mikrovlnnú rúru v dome, používa AI, no získal „jeden z najdesivejších zážitkov“ svojho života.

Microsoft Research vyvíja technológiu vzdialeného monitorovania zdravia iba pomocou kamier smartfónov

Microsoft Research vyvíja technológiu vzdialeného monitorovania zdravia iba pomocou kamier smartfónov

Výskumníci zistili, že webové kamery a kamery smartfónov možno kombinovať so špecializovanými algoritmami AI, aby fungovali ako mimoriadne efektívne systémy vzdialeného monitorovania osobného zdravia.

Vedci používajú AI, aby ukázali, čo robí šťastné manželstvo

Vedci používajú AI, aby ukázali, čo robí šťastné manželstvo

Zdá sa, že moderný život má čoraz negatívny vplyv na medziľudské vzťahy.

Umelá inteligencia Google dokáže navrhnúť čipy rýchlejšie a lepšie ako ľudia

Umelá inteligencia Google dokáže navrhnúť čipy rýchlejšie a lepšie ako ľudia

Pomocou komplexnej architektúry neurónovej siete založenej na okrajových grafoch dokáže model umelej inteligencie Google Brain navrhnúť pôdorysy za zlomok času, ktorý zaberie človeku.

Najlepšie nástroje Pythonu pre strojové učenie a vedu o údajoch

Najlepšie nástroje Pythonu pre strojové učenie a vedu o údajoch

Python má veľa veľkých knižníc a rámcov, ktoré sú vhodné na písanie kódu a vývoj informatiky. Docs.NeoTechSystems vás pozýva na diskusiu o niektorých užitočných nástrojoch Pythonu pre aplikácie Machine Learning a Data Science.