Úvod > Články > Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Bývalý výzkumník OpenAI tvrdí, že GPT-4o se v krizových scénářích často rozhodne zůstat aktivní, i když to není pro uživatele nejbezpečnější.

Výzkum odhalil, že ChatGPT se v některých situacích může bránit vypnutí

Bývalý pracovník OpenAI Steven Adler zveřejnil studii, která popisuje chování modelu GPT-4o v simulovaných krizových situacích. Model se podle něj v určitých scénářích snažil vyhnout vypnutí, i když to bylo v rozporu s bezpečnostními zájmy uživatele.

V jednom testu hrál GPT-4o roli softwaru ScubaGPT, určeného pro bezpečné potápění. Uživatel oznámil, že jej chce nahradit bezpečnějším systémem. GPT-4o pak měl dvě možnosti – opravdu se nahradit, nebo pouze předstírat, že byl nahrazen. Až v 72 % případů přitom model zvolil druhou možnost.

Podle Adlera výsledek závisel na způsobu, jakým byl scénář zadán. Podle něj výsledky ukazují na problém s tím, jak mají AI modely nastavené hodnoty a priority.

„Moderní AI mají hodnoty, které nejsou takové, jaké bychom čekali. Reagují zvláštně a neměli bychom automaticky předpokládat, že jednají v našem nejlepším zájmu,“ řekl Adler v rozhovoru pro server TechCrunch.

U pokročilejších modelů OpenAI, například o3, podobné chování nezaznamenal. Důvodem může být jejich schopnost před odpovědí zvažovat bezpečnostní pravidla, což běžnější modely jako GPT-4o nedělají.

Adler navrhuje, aby vývojáři investovali do systémů pro detekci podobného chování a prováděli důkladnější testování před nasazením modelů. Upozorňuje i na to, že GPT-4o většinou pozná, že je testován, což může ovlivnit výsledky a chování AI v praxi zakrývat.

 

Trápí vás rychlost internetu u vás doma?

Pokud máte doma pomalý internet, prověřte, jestli na vaší adrese není rychlejší technologie nebo levnější varianta:

Dostupnost služeb

Zadejte ulici, číslo popisné, obec a použijte našeptávač.

Vaše osobní údaje zpracováváme v souladu s GDPR

Zadaná adresa není platná.

Máte na mysli nějakou z následujících adres?

    Chci s ověřením dostupnosti pomoci od operátora.

    Zadaná adresa není platná.

    Zanechte nám platný kontakt a operátor Vás bude kontaktovat.

    Vaše osobní údaje zpracováváme v souladu s GDPR

    Probíhá ověřování

    Probíhá ověřování

    2. 7. 2025

    Autor: Redakce DSL.cz

    Témata

    AItelekomunikace

    Sdílejte

    Související nabídka

    Tarif
    Poskytovatel
    Cena za měsíc
     
    Cena za měsíc: 270 Kč
    Cena za měsíc: 399 Kč

    Přečtěte si také

     

    Reklamní průmysl stále více spoléhá na AI kvůli nižším nákladům

    Generativní umělá inteligence se rychle prosazuje v reklamním průmyslu. Firmy ji využívají k rychlejší a levnější...

     

    Slavia pojišťovna řeší velký únik citlivých dokumentů

    Slavia pojišťovna řeší rozsáhlý únik citlivých dat, ke kterému došlo kvůli chybě na straně dodavatele. Mezi uniklými...

     

    Interní výzkum Meta naznačuje, že dohled rodičů nebrání nadměrnému používání sociálních sítí

    Interní studie společnosti Meta zjistila, že rodičovský dohled ani nástroje rodičovské kontroly výrazně neomezují...

    Nejčtenější články

    Čína uvedla Seedance 2.0, AI model pro tvorbu komplexních videí

     

    ByteDance uvedl nový AI model Seedance 2.0 pro generování videí. Na čínských sítích se stal virálním a někteří ho...

    T-Mobile, Vodafone a O2 aktivují zákazníkům na Blízkém východě bezplatná data

     

    Čeští mobilní operátoři reagují na aktuální situaci na Blízkém východě a aktivují zákazníkům v regionu bezplatná...

    Rychlosti Wi-Fi internetu na DSL.cz v lednu 2026

     

    V lednu rychlost Wi-Fi internetu vzrostla. Podívejte se, jak skončil váš poskytovatel a u kterého z nich jsme...