Úvod > Články > Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Bývalý výzkumník OpenAI tvrdí, že GPT-4o se v krizových scénářích často rozhodne zůstat aktivní, i když to není pro uživatele nejbezpečnější.

Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Bývalý pracovník OpenAI Steven Adler zveřejnil studii, která popisuje chování modelu GPT-4o v simulovaných krizových situacích. Model se podle něj v určitých scénářích snažil vyhnout vypnutí, i když to bylo v rozporu s bezpečnostními zájmy uživatele.

V jednom testu hrál GPT-4o roli softwaru ScubaGPT, určeného pro bezpečné potápění. Uživatel oznámil, že jej chce nahradit bezpečnějším systémem. GPT-4o pak měl dvě možnosti – opravdu se nahradit, nebo pouze předstírat, že byl nahrazen. Až v 72 % případů přitom model zvolil druhou možnost.

Podle Adlera výsledek závisel na způsobu, jakým byl scénář zadán. Podle něj výsledky ukazují na problém s tím, jak mají AI modely nastavené hodnoty a priority.

„Moderní AI mají hodnoty, které nejsou takové, jaké bychom čekali. Reagují zvláštně a neměli bychom automaticky předpokládat, že jednají v našem nejlepším zájmu,“ řekl Adler v rozhovoru pro server TechCrunch.

U pokročilejších modelů OpenAI, například o3, podobné chování nezaznamenal. Důvodem může být jejich schopnost před odpovědí zvažovat bezpečnostní pravidla, což běžnější modely jako GPT-4o nedělají.

Adler navrhuje, aby vývojáři investovali do systémů pro detekci podobného chování a prováděli důkladnější testování před nasazením modelů. Upozorňuje i na to, že GPT-4o většinou pozná, že je testován, což může ovlivnit výsledky a chování AI v praxi zakrývat.

 

Trápí vás rychlost internetu u vás doma?

Pokud máte doma pomalý internet, prověřte, jestli na vaší adrese není rychlejší technologie nebo levnější varianta:

Dostupnost služeb

Zadejte ulici, číslo popisné, obec a použijte našeptávač.

Vaše osobní údaje zpracováváme v souladu s GDPR

Zadaná adresa není platná.

Máte na mysli nějakou z následujících adres?

    Chci s ověřením dostupnosti pomoci od operátora.

    Zadaná adresa není platná.

    Zanechte nám platný kontakt a operátor Vás bude kontaktovat.

    Vaše osobní údaje zpracováváme v souladu s GDPR

    Probíhá ověřování

    Probíhá ověřování

    2. 7. 2025

    Autor: Redakce DSL.cz

    Témata

    AItelekomunikace

    Sdílejte

    Související nabídka

    Tarif
    Poskytovatel
    Cena za měsíc
     
    Cena za měsíc: 270 Kč
    Cena za měsíc: 399 Kč

    Přečtěte si také

     

    Grokipedia Elona Muska cituje neonacistické, krajně pravicové a dezinformační weby

    Američtí výzkumníci zjistili, že Grokipedia odkazuje na neonacistické, krajně pravicové a dezinformační zdroje...

     

    ChatGPT podle OpenAI nenese vinu za sebevraždu teenagera, porušil pravidla služby

    OpenAI u soudu tvrdí, že nenese odpovědnost za smrt šestnáctiletého teenagera a že chlapec chatbota nesprávně...

     

    Rusko blokuje FaceTime, stupňuje tak tlak na zahraniční platformy

    Rusko zablokovalo službu FaceTime s odkazem na její údajné zneužívání k trestné činnosti. Kritici krok označují za...

    Nejčtenější články

    Rychlosti Wi-Fi internetu na DSL.cz v říjnu 2025

     

    V říjnu rychlost Wi-Fi internetu opět rostla. Podívejte se, jak skončil váš poskytovatel a u které firmy jsme...

    Dvojnásobná rychlost, stejná cena: O2 uvádí nový tarif Internet MAX 500

     

    O2 představil nový tarif Internet MAX 500, který přináší dvojnásobnou rychlost připojení díky technologii VDSL...

    Výpadek Cloudflare ochromil X i ChatGPT, firma se omluvila a přiznala chybu

     

    Technické problémy u společnosti Cloudflare způsobily v úterý výpadek řady známých webů a aplikací včetně ChatGPT a...