Úvod > Články > Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Bývalý výzkumník OpenAI tvrdí, že GPT-4o se v krizových scénářích často rozhodne zůstat aktivní, i když to není pro uživatele nejbezpečnější.

Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Bývalý pracovník OpenAI Steven Adler zveřejnil studii, která popisuje chování modelu GPT-4o v simulovaných krizových situacích. Model se podle něj v určitých scénářích snažil vyhnout vypnutí, i když to bylo v rozporu s bezpečnostními zájmy uživatele.

V jednom testu hrál GPT-4o roli softwaru ScubaGPT, určeného pro bezpečné potápění. Uživatel oznámil, že jej chce nahradit bezpečnějším systémem. GPT-4o pak měl dvě možnosti – opravdu se nahradit, nebo pouze předstírat, že byl nahrazen. Až v 72 % případů přitom model zvolil druhou možnost.

Podle Adlera výsledek závisel na způsobu, jakým byl scénář zadán. Podle něj výsledky ukazují na problém s tím, jak mají AI modely nastavené hodnoty a priority.

„Moderní AI mají hodnoty, které nejsou takové, jaké bychom čekali. Reagují zvláštně a neměli bychom automaticky předpokládat, že jednají v našem nejlepším zájmu,“ řekl Adler v rozhovoru pro server TechCrunch.

U pokročilejších modelů OpenAI, například o3, podobné chování nezaznamenal. Důvodem může být jejich schopnost před odpovědí zvažovat bezpečnostní pravidla, což běžnější modely jako GPT-4o nedělají.

Adler navrhuje, aby vývojáři investovali do systémů pro detekci podobného chování a prováděli důkladnější testování před nasazením modelů. Upozorňuje i na to, že GPT-4o většinou pozná, že je testován, což může ovlivnit výsledky a chování AI v praxi zakrývat.

 

Trápí vás rychlost internetu u vás doma?

Pokud máte doma pomalý internet, prověřte, jestli na vaší adrese není rychlejší technologie nebo levnější varianta:

Dostupnost služeb

Zadejte ulici, číslo popisné, obec a použijte našeptávač.

Vaše osobní údaje zpracováváme v souladu s GDPR

Zadaná adresa není platná.

Máte na mysli nějakou z následujících adres?

    Chci s ověřením dostupnosti pomoci od operátora.

    Zadaná adresa není platná.

    Zanechte nám platný kontakt a operátor Vás bude kontaktovat.

    Vaše osobní údaje zpracováváme v souladu s GDPR

    Probíhá ověřování

    Probíhá ověřování

    2. 7. 2025

    Autor: Redakce DSL.cz

    Témata

    AItelekomunikace

    Sdílejte

    Související nabídka

    Tarif
    Poskytovatel
    Cena za měsíc
     
    Cena za měsíc: 260 Kč
    Cena za měsíc: 399 Kč

    Přečtěte si také

     

    YouTube zpřísňuje pravidla, tvůrcům už nebude platit za obsah generovaný AI

    YouTube zpřísňuje podmínky pro tvůrce. Monetizace se nově nebude týkat neautentického obsahu, který často vzniká za...

     

    Dejte si pozor při cestách do Egypta, místní SIM karty mohou zablokovat váš telefon

    V Egyptě platí od letoška nové pravidlo, které může zablokovat váš telefon. Místo místních SIM karet tak raději...

     

    Slovensko vydražilo mobilní frekvence s rekordním výnosem přes 500 milionů eur

    Slovenský regulační úřad úspěšně ukončil největší aukci frekvencí v historii země. Zájem operátorů výrazně překonal...

    Nejčtenější články

    Všichni podnikatelé se musí do 30. června registrovat u České televize a Českého rozhlasu

     

    Od července se mění pravidla pro rozhlasové a televizní poplatky. Podnikatelé musí do 30. června ČT a ČRo oznámit...

    Britská komisařka vyzývá k zákazu AI aplikací generujících obrázky nahých dětí

     

    Britská komisařka Rachel de Souza požaduje úplný zákaz AI nástrojů, které upravují nebo generují obrázky nahých...

    Meta zavádí reklamy v aplikaci WhatsApp

     

    Meta po 11 letech zavádí reklamy přímo do WhatsAppu. Budou se zobrazovat v záložce Updates, mimo osobní chaty.