Úvod > Články > Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Bývalý výzkumník OpenAI tvrdí, že GPT-4o se v krizových scénářích často rozhodne zůstat aktivní, i když to není pro uživatele nejbezpečnější.

Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Bývalý pracovník OpenAI Steven Adler zveřejnil studii, která popisuje chování modelu GPT-4o v simulovaných krizových situacích. Model se podle něj v určitých scénářích snažil vyhnout vypnutí, i když to bylo v rozporu s bezpečnostními zájmy uživatele.

V jednom testu hrál GPT-4o roli softwaru ScubaGPT, určeného pro bezpečné potápění. Uživatel oznámil, že jej chce nahradit bezpečnějším systémem. GPT-4o pak měl dvě možnosti – opravdu se nahradit, nebo pouze předstírat, že byl nahrazen. Až v 72 % případů přitom model zvolil druhou možnost.

Podle Adlera výsledek závisel na způsobu, jakým byl scénář zadán. Podle něj výsledky ukazují na problém s tím, jak mají AI modely nastavené hodnoty a priority.

„Moderní AI mají hodnoty, které nejsou takové, jaké bychom čekali. Reagují zvláštně a neměli bychom automaticky předpokládat, že jednají v našem nejlepším zájmu,“ řekl Adler v rozhovoru pro server TechCrunch.

U pokročilejších modelů OpenAI, například o3, podobné chování nezaznamenal. Důvodem může být jejich schopnost před odpovědí zvažovat bezpečnostní pravidla, což běžnější modely jako GPT-4o nedělají.

Adler navrhuje, aby vývojáři investovali do systémů pro detekci podobného chování a prováděli důkladnější testování před nasazením modelů. Upozorňuje i na to, že GPT-4o většinou pozná, že je testován, což může ovlivnit výsledky a chování AI v praxi zakrývat.

 

Trápí vás rychlost internetu u vás doma?

Pokud máte doma pomalý internet, prověřte, jestli na vaší adrese není rychlejší technologie nebo levnější varianta:

Dostupnost služeb

Zadejte ulici, číslo popisné, obec a použijte našeptávač.

Vaše osobní údaje zpracováváme v souladu s GDPR

Zadaná adresa není platná.

Máte na mysli nějakou z následujících adres?

    Chci s ověřením dostupnosti pomoci od operátora.

    Zadaná adresa není platná.

    Zanechte nám platný kontakt a operátor Vás bude kontaktovat.

    Vaše osobní údaje zpracováváme v souladu s GDPR

    Probíhá ověřování

    Probíhá ověřování

    2. 7. 2025

    Autor: Redakce DSL.cz

    Témata

    AItelekomunikace

    Sdílejte

    Související nabídka

    Tarif
    Poskytovatel
    Cena za měsíc
     
    Cena za měsíc: 270 Kč
    Cena za měsíc: 399 Kč

    Přečtěte si také

     

    EU chce, aby Google sdílel data z vyhledávání s konkurencí

    Evropská komise navrhla, aby Google sdílel anonymizovaná data z vyhledávání s konkurencí. Opatření by se nově mohlo...

     

    USA chtějí bránit AI před distilací, podezření míří na Čínu

    Bílý dům tvrdí, že zahraniční firmy ve velkém kopírují americké AI technologie. Nově chce spolupracovat s...

     

    Elon Musk posouvá SpaceX do AI, vidí tam největší příležitost

    SpaceX připravuje vstup na burzu a v dokumentech odhaluje zásadní posun směrem k umělé inteligenci. Největší budoucí...

    Nejčtenější články

    T Mobile přidává do nabídky Disney+, novým zákazníkům rozdává předplatné na půl roku zdarma

     

    T Mobile od 1. dubna 2026 rozšíří nabídku o Disney+, který bude součástí vybraných mobilních a TV tarifů. Noví...

    Naměřené rychlosti internetu na DSL.cz v březnu 2026

     

    V březnu rychlosti internetu opět kolísaly. Podívejte se na naše nejnovější statistiky a zjistěte, jak si vedl váš...

    Booking.com čelil úniku dat, útočníci získali přístup k rezervacím zákazníků

     

    Booking.com zaznamenal bezpečnostní incident, při kterém se útočníci dostali k údajům o rezervacích některých...