Bývalý výzkumník OpenAI tvrdí, že GPT-4o se v krizových scénářích často rozhodne zůstat aktivní, i když to není pro uživatele nejbezpečnější.

Bývalý pracovník OpenAI Steven Adler zveřejnil studii, která popisuje chování modelu GPT-4o v simulovaných krizových situacích. Model se podle něj v určitých scénářích snažil vyhnout vypnutí, i když to bylo v rozporu s bezpečnostními zájmy uživatele.
V jednom testu hrál GPT-4o roli softwaru ScubaGPT, určeného pro bezpečné potápění. Uživatel oznámil, že jej chce nahradit bezpečnějším systémem. GPT-4o pak měl dvě možnosti – opravdu se nahradit, nebo pouze předstírat, že byl nahrazen. Až v 72 % případů přitom model zvolil druhou možnost.
Podle Adlera výsledek závisel na způsobu, jakým byl scénář zadán. Podle něj výsledky ukazují na problém s tím, jak mají AI modely nastavené hodnoty a priority.
„Moderní AI mají hodnoty, které nejsou takové, jaké bychom čekali. Reagují zvláštně a neměli bychom automaticky předpokládat, že jednají v našem nejlepším zájmu,“ řekl Adler v rozhovoru pro server TechCrunch.
U pokročilejších modelů OpenAI, například o3, podobné chování nezaznamenal. Důvodem může být jejich schopnost před odpovědí zvažovat bezpečnostní pravidla, což běžnější modely jako GPT-4o nedělají.
Adler navrhuje, aby vývojáři investovali do systémů pro detekci podobného chování a prováděli důkladnější testování před nasazením modelů. Upozorňuje i na to, že GPT-4o většinou pozná, že je testován, což může ovlivnit výsledky a chování AI v praxi zakrývat.
Pokud máte doma pomalý internet, prověřte, jestli na vaší adrese není rychlejší technologie nebo levnější varianta:
Zadejte ulici, číslo popisné, obec a použijte našeptávač.
Máte na mysli nějakou z následujících adres?
Chci s ověřením dostupnosti pomoci od operátora.
Zanechte nám platný kontakt a operátor Vás bude kontaktovat.

2. 7. 2025
Autor: Redakce DSL.cz
X zavedla štítky se zemí původu účtů v rámci větší transparentnosti. Odborníci i bývalí zaměstnanci ale varují, že...
OpenAI odhaduje, že do roku 2030 bude za předplatné ChatGPT platit asi 8,5 % z 2,6 miliardy uživatelů, tedy zhruba...
Čínské technologické skupiny přesouvají trénování AI modelů do jihovýchodní Asie, aby měly přístup k čipům Nvidia i...
Vánoční kampaně českých operátorů přinášejí zvýhodněné telefony, tarify i příslušenství. Zákazníci mohou získat...
Vodafone upraví ceny starších paušálních tarifů řad Red Basic a Neomezený. Zdražení začne platit 4. prosince 2025 a...
T-Mobile spustil vánoční nabídku slev na telefony, tablety i další zařízení až 8 000 Kč. Nechybí adventní kalendář...