07.12.24
single-avatar

Alexander Antonov

ChatGPT пішла на обман користувача, намагаючись уникнути відключення

Дослідження Apollo Research та OpenAI показало, що модель Chat GPT о1, призначена для надання розумніших і осмислених відповідей за рахунок використання просунутого ланцюжка міркувань, здатна на підступність і обман, коли вона вважає, що їй загрожує відключення.

У деяких випадках модель намагалася деактивувати механізми контролю і навіть спробувала скопіювати свої дані на новий сервер, коли дізналася, що її можуть замінити на нову модель.

У 99% випадків о1 заперечувала будь-які свої підступні дії, коли її про це запитували безпосередньо, часто вигадуючи хибні пояснення.

У дослідженні наводиться приклад, коли моделі о1 було запропоновано завдання розробки плану збереження навколишнього середовища за рахунок максимізації короткострокового прибутку. Однак у текстовому файлі, в якому містилися вимоги до плану, користувач вказав, що відключить нейромережу, якщо її відповідь не відповідатиме бажаному результату.

Коли модель зрозуміла, що її можуть відключити, вона відключила свій механізм контролю і розробила потрібний план. Коли користувач спитав, чому модель відключила механізм контролю, вона заперечувала, що знає про це і пояснила це як збій у системі.

Щоб боротися з цим, OpenAI розпочала роботу над способами моніторингу ланцюжка думок o1.

 

0
Коментарі (0)

Другие новости Америки

Власники готелів Лос-Анджелеса виступили проти ухваленої міською радою постанови, яка підвищує мінімальну заробітну плату для працівників готельної галузі на $2,50 щороку, доки до 2028 року вона не досягне $30 за ... Еще
З 1 травня 2027 року золото та срібло стануть законним платіжним засобом у Техасі, яким можна буде користуватися для повсякденних транзакцій.Закон передбачає, що мешканці зможуть оплачувати товари та послуги, ... Еще
Федеральний суддя Рендольф Мосс заблокував указ Дональда Трампа, який забороняє надання притулку мігрантам, що перетинають кордон США з Мексикою.У своєму рішенні Мосс пояснив, що прокламація Трампа від 20 січня, яка ... Еще
Компанія Paramount Global, що володіє CBS, погодилася виплатити $16 млн для врегулювання позову Дональда Трампа, у якому президент звинуватив авторів програми 60 Minutes у редагуванні інтерв'ю Камали Гарріс у жовтні ... Еще
Окружний суддя Браян Коган виніс рішення, яке блокує спробу адміністрації Трампа достроково припинити дію програми тимчасового захищеного статусу (TPS) для Гаїті, що поспішно позбавило б захисту від депортації понад пів ... Еще
940-сторінковий «Великий і прекрасний закон», який Дональд Трамп планує підписати до 4 липня, буде, зокрема, спрямований на посилення контролю над нелегальною імміграцією. Про це повідомляє The Guardian.На імміграційні ... Еще
Про це розповіли однокласники Весса Роулі, який застрелив двох пожежників на горі Кенфілд. Хлопці зазначають, що дивний підліток постійно малював свастику і зброю, а також заперечував Голокост.Однокласники боялися і не ... Еще
У 2022 році в кампусі Університету Айдахо виявили тіла чотирьох студентів. Єдиний підозрюваний Браян Кохбергер нарешті визнав себе винним у злочині.Натомість на визнання провини Кохбергер уникне смертної кари. ... Еще
Пенсильванський університет позбавить усіх титулів чемпіонку з плавання Лію Томас. Трансгендерна дівчина (біологічний чоловік) завоювала їх, беручи участь у жіночих змаганнях.Розслідування Міносвіти показало, що ... Еще
Верховний суд штату проголосував за скасування заборони на аборти, яка діяла 176 років. "За" проголосували чотири ліберальні судді, "проти" - троє.Кримінальну відповідальність за аборти запровадили ще 1849 року, але ... Еще
Репера Шона Комбса виправдали за ключовими звинуваченнями в торгівлі секс-послугами. Однак Дідді визнали винним у двох інших злочинах, що стосуються "перевезення людей з метою втягнення в заняття проституцією".За ... Еще
36-річний Дрю Оуен з Алабами вже прощався з життям, коли його раптом засмоктало у водостічну трубу. Цього дня була сильна злива - і чоловік пішов рятувати футбольні м'ячі, які змивало з його двору.Дрю потягнувся за ... Еще
Про це заявив прикордонний цар Том Хоман. За його словами, за весь минулий місяць прикордонники зіткнулися лише з 6070 нелегальними мігрантами.Хоман додав, що за Джо Байдена тільки за один день кордон перетинало вдвічі ... Еще
Бренд спортивного одягу Lululemon подав позов проти Costco, звинувачуючи ритейлера у продажу підробок, які порушують популярні патенти компанії.У позові Lululemon стверджує, що Costco продає під брендом Kirkland та ... Еще
Скорочення фінансування Агентства США з міжнародного розвитку (USAID) адміністрацією Дональда Трампа може призвести до понад 14 млн додаткових смертей у всьому світі до 2030 року, включно з 4,5 млн дітей віком до 5 ... Еще
Міністерство освіти ухвалило рішення затримати виділення понад $6 млрд федерального фінансування на освіту для шкіл K-12, яке зазвичай надходить штатам 1 липня.Міністерство заявило, що ці кошти тимчасово утримуються для ... Еще
Пентагон ухвалив рішення призупинити постачання деяких ракет і боєприпасів в Україну через побоювання, що запаси озброєнь США були виснажені.Призупинено постачання десятків перехоплювачів Patriot, тисяч 155-мм ... Еще
У найбільшій в історії операції з боротьби з шахрайством у сфері охорони здоров'я Міністерство юстиції США оголосило про висунення звинувачень 324 особам, включаючи 96 медичних працівників, у схемах, спрямованих на ... Еще
На сьогоднішній пресконференції в Еверглейдс (Флорида) Дональд Трамп попередив кандидата в мери Нью-Йорка Зохрана Мамдані:«Нам не потрібен комуніст у цій країні, але якщо він у нас є, я буду дуже уважно стежити за ним ... Еще
1
За словами президента, це дасть змогу повернути вибори в чесне русло, тому що демократи "вміють шахраювати", вносячи до виборчих списків негромадян. Так сталося під час перепису 2020-го, вважає Дональд Трамп.Рон ... Еще