Bývalý výzkumník OpenAI tvrdí, že GPT-4o se v krizových scénářích často rozhodne zůstat aktivní, i když to není pro uživatele nejbezpečnější.

Bývalý pracovník OpenAI Steven Adler zveřejnil studii, která popisuje chování modelu GPT-4o v simulovaných krizových situacích. Model se podle něj v určitých scénářích snažil vyhnout vypnutí, i když to bylo v rozporu s bezpečnostními zájmy uživatele.
V jednom testu hrál GPT-4o roli softwaru ScubaGPT, určeného pro bezpečné potápění. Uživatel oznámil, že jej chce nahradit bezpečnějším systémem. GPT-4o pak měl dvě možnosti – opravdu se nahradit, nebo pouze předstírat, že byl nahrazen. Až v 72 % případů přitom model zvolil druhou možnost.
Podle Adlera výsledek závisel na způsobu, jakým byl scénář zadán. Podle něj výsledky ukazují na problém s tím, jak mají AI modely nastavené hodnoty a priority.
„Moderní AI mají hodnoty, které nejsou takové, jaké bychom čekali. Reagují zvláštně a neměli bychom automaticky předpokládat, že jednají v našem nejlepším zájmu,“ řekl Adler v rozhovoru pro server TechCrunch.
U pokročilejších modelů OpenAI, například o3, podobné chování nezaznamenal. Důvodem může být jejich schopnost před odpovědí zvažovat bezpečnostní pravidla, což běžnější modely jako GPT-4o nedělají.
Adler navrhuje, aby vývojáři investovali do systémů pro detekci podobného chování a prováděli důkladnější testování před nasazením modelů. Upozorňuje i na to, že GPT-4o většinou pozná, že je testován, což může ovlivnit výsledky a chování AI v praxi zakrývat.
Pokud máte doma pomalý internet, prověřte, jestli na vaší adrese není rychlejší technologie nebo levnější varianta:
Zadejte ulici, číslo popisné, obec a použijte našeptávač.
Máte na mysli nějakou z následujících adres?
Chci s ověřením dostupnosti pomoci od operátora.
Zanechte nám platný kontakt a operátor Vás bude kontaktovat.

2. 7. 2025
Autor: Redakce DSL.cz
Evropská komise navrhla, aby Google sdílel anonymizovaná data z vyhledávání s konkurencí. Opatření by se nově mohlo...
Bílý dům tvrdí, že zahraniční firmy ve velkém kopírují americké AI technologie. Nově chce spolupracovat s...
SpaceX připravuje vstup na burzu a v dokumentech odhaluje zásadní posun směrem k umělé inteligenci. Největší budoucí...
T Mobile od 1. dubna 2026 rozšíří nabídku o Disney+, který bude součástí vybraných mobilních a TV tarifů. Noví...
V březnu rychlosti internetu opět kolísaly. Podívejte se na naše nejnovější statistiky a zjistěte, jak si vedl váš...
Booking.com zaznamenal bezpečnostní incident, při kterém se útočníci dostali k údajům o rezervacích některých...