Bývalý výzkumník OpenAI tvrdí, že GPT-4o se v krizových scénářích často rozhodne zůstat aktivní, i když to není pro uživatele nejbezpečnější.

Bývalý pracovník OpenAI Steven Adler zveřejnil studii, která popisuje chování modelu GPT-4o v simulovaných krizových situacích. Model se podle něj v určitých scénářích snažil vyhnout vypnutí, i když to bylo v rozporu s bezpečnostními zájmy uživatele.
V jednom testu hrál GPT-4o roli softwaru ScubaGPT, určeného pro bezpečné potápění. Uživatel oznámil, že jej chce nahradit bezpečnějším systémem. GPT-4o pak měl dvě možnosti – opravdu se nahradit, nebo pouze předstírat, že byl nahrazen. Až v 72 % případů přitom model zvolil druhou možnost.
Podle Adlera výsledek závisel na způsobu, jakým byl scénář zadán. Podle něj výsledky ukazují na problém s tím, jak mají AI modely nastavené hodnoty a priority.
„Moderní AI mají hodnoty, které nejsou takové, jaké bychom čekali. Reagují zvláštně a neměli bychom automaticky předpokládat, že jednají v našem nejlepším zájmu,“ řekl Adler v rozhovoru pro server TechCrunch.
U pokročilejších modelů OpenAI, například o3, podobné chování nezaznamenal. Důvodem může být jejich schopnost před odpovědí zvažovat bezpečnostní pravidla, což běžnější modely jako GPT-4o nedělají.
Adler navrhuje, aby vývojáři investovali do systémů pro detekci podobného chování a prováděli důkladnější testování před nasazením modelů. Upozorňuje i na to, že GPT-4o většinou pozná, že je testován, což může ovlivnit výsledky a chování AI v praxi zakrývat.
Pokud máte doma pomalý internet, prověřte, jestli na vaší adrese není rychlejší technologie nebo levnější varianta:
Zadejte ulici, číslo popisné, obec a použijte našeptávač.
Máte na mysli nějakou z následujících adres?
Chci s ověřením dostupnosti pomoci od operátora.
Zanechte nám platný kontakt a operátor Vás bude kontaktovat.

2. 7. 2025
Autor: Redakce DSL.cz
Americká vláda schválila prodej pokročilých AI čipů Nvidia H200 do Číny, ale jen za splnění přísných podmínek...
Mateřská firma Googlu Alphabet se stala čtvrtou společností na světě s tržní hodnotou přes 4 biliony dolarů. Akcie...
Satelitní internet Starlink dočasně zpřístupnil bezplatné připojení ve Venezuele po amerických náletech a zatčení...
Pokud zrovna řešíte, jak zasimulovat Ježíškovo zazvonění tak, aby vás děti neodhalily, máme pro vás pár tipů...
Zítra se opět posadíme k televizím a odstartuje každoroční maraton vánočních pohádek. V dnešním článku najdete...
Pokud vám doručovací služby nedodaly vánoční dárky, u kterých garantovaly doručení do Štědrého dne a prodejce vám...