header-logo
Вхід і реєстрація
07.12.24
single-avatar

Alexander Antonov

ChatGPT пішла на обман користувача, намагаючись уникнути відключення

Дослідження Apollo Research та OpenAI показало, що модель Chat GPT о1, призначена для надання розумніших і осмислених відповідей за рахунок використання просунутого ланцюжка міркувань, здатна на підступність і обман, коли вона вважає, що їй загрожує відключення.

У деяких випадках модель намагалася деактивувати механізми контролю і навіть спробувала скопіювати свої дані на новий сервер, коли дізналася, що її можуть замінити на нову модель.

У 99% випадків о1 заперечувала будь-які свої підступні дії, коли її про це запитували безпосередньо, часто вигадуючи хибні пояснення.

У дослідженні наводиться приклад, коли моделі о1 було запропоновано завдання розробки плану збереження навколишнього середовища за рахунок максимізації короткострокового прибутку. Однак у текстовому файлі, в якому містилися вимоги до плану, користувач вказав, що відключить нейромережу, якщо її відповідь не відповідатиме бажаному результату.

Коли модель зрозуміла, що її можуть відключити, вона відключила свій механізм контролю і розробила потрібний план. Коли користувач спитав, чому модель відключила механізм контролю, вона заперечувала, що знає про це і пояснила це як збій у системі.

Щоб боротися з цим, OpenAI розпочала роботу над способами моніторингу ланцюжка думок o1.

 

0
Коментарі

Коментарів немає. Будьте першим

Інші новини Америки

ПолітикаНовини світу
У суботу Ізраїль завдав удару в місті Газа, в результаті якого загинув Раед Саад - заступник командира військового крила ХАМАС і один з імовірних організаторів різанини 7 жовтня. Всього в атаці загинули чотири людини, ...
Кримінал
18-річний Мухаммад Умурзоков став другою жертвою стрілянини в університеті Брауна. Він був талановитим і перспективним студентом на стипендії, який мріяв стати нейрохірургом, заявили родичі. Сім'я Мухаммада приїхала до ...
ПолітикаФінансиЕкономіяБізнес
Дональд Трамп забезпечив угоду щодо критичних мінералів, яка зміцнює національну безпеку США і знижує залежність від іноземних ланцюгів поставок, заявив міністр торгівлі Говард Лютник. Міністр оголосив про велику угоду ...
ПолітикаВійна в Україні
Другий раунд переговорів між українською делегацією та американськими посланцями Стівом Віткоффом і Джаредом Кушнером відбувся сьогодні в Берліні за участю Володимира Зеленського. Як повідомляють джерела, Дональд Трамп ...
ПодіїПоліцейські хроніки
Роб Рейнер і його дружина Мішель були зарізані у своєму будинку в Лос-Анджелесі. Тіла з перерізаними горлами виявила їхня дочка Ромі.32-річний син пари Нік Рейнер взятий під варту за звинуваченням у вбивстві і перебуває ...
Кримінал
ФБР заарештувало чотирьох ймовірних членів екстремістської групи Turtle Island Liberation Front в Лусерн-Веллі, де вони готувалися випробувати саморобні вибухові пристрої. Організація дотримується антиурядових і ...
ЗіркиПодіїПоліцейські хроніки
Актор і режисер Роб Рейнер разом з дружиною Мішель Рейнер знайдені мертвими в своєму будинку в районі Брентвуд Лос-Анджелеса. Їх знайшла дочка, яка викликала екстрені служби. Смерті розслідуються як вбивство: вже ...
Новини світу
У неділю батько і син атакували святкування Хануки на пляжі Бонді в Сіднеї, вбивши 15 осіб. У лікарнях опинилися 40 осіб, включаючи тяжко поранених.Нападниками виявилися 50-річний Саджит Акрам, який приїхав до Австралії ...
ПодіїПоліцейські хроніки
Елла Кук, студентка другого курсу університету Брауна, стала однією з двох студентів, застрелених під час сесії підготовки до іспитів у суботу вдень. Вона була віце-президентом клубу республіканців університету, родом з ...
Спільнота
Округ Сан-Дієго розмістив на сайті слайд-шоу «Терміни LGBTQIA+, які потрібно знати», де описано дев'ять гендерних ідентичностей, включаючи трансгендер, нон-бінарний і гендерфлюїд. У матеріалах також представлена ...
Новини світу
Нападниками на святкування Хануки на пляжі Бонді виявилися 24-річний Навід Акрам і його 50-річний батько. Вони відкрили вогонь з рушниць і гвинтівки. Батько був убитий у перестрілці з поліцією на місці, а Навід Акрам ...
ПодіїПоліцейські хроніки
6-річна дівчинка з Нью-Гемпшира була госпіталізована після того, як з'їла цукерку з ТГК (психоактивна речовина в канабісі). У лікарні аналіз показав позитивний результат на канабіноїди та кокаїн.30-річну Пейдж Гуле ...
ПолітикаВійна в Україні
Володимир Зеленський оголосив про відмову від мети вступу до НАТО в обмін на гарантії безпеки від США, Європи та інших партнерів. Він назвав це компромісом з боку України і зажадав, щоб гарантії були юридично ...
Політика
Дональд Трамп заявив, що не може гарантувати збереження більшості республіканців у Палаті представників на проміжних виборах 2026 року. Президент сказав: "Ми побачимо, що станеться. Ми повинні перемогти. Але, знаєте, ...
Новини світуНаука і технології
Роскомнадзор заблокував американську ігрову платформу Roblox. Причиною назвали наявність невідповідного контенту, який може негативно впливати на духовний і моральний розвиток дітей.Сьогодні в Томську в парку імені ...
Спільнота
У 2025 році скарги на публічне сечовипускання зросли на 19,9% порівняно з 2024 роком, на вживання наркотиків у громадських місцях - на 16%, а на розпивання алкоголю - на 10%. Також збільшилися скарги на шум (на 15%) і ...
ПодіїПоліцейські хроніки
У суботу в будівлі Barus & Holley університету Брауна в Провіденсі сталася стрілянина під час підготовки до фінального іспиту в аудиторії. Двоє людей загинули, дев'ятеро отримали поранення і були доставлені до ...
СпільнотаФінансиЕкономіяБізнес
Понад 75% виставлених на продаж будинків у США недоступні для середнього американського домогосподарства. Такого висновку дійшов аналітичний портал Bankrate у новому дослідженні ринку нерухомості.Щоб дозволити собі ...
СпільнотаФінансиЕкономіяБізнесЗдоров'я
Каліфорнійське журі присяжних зобов'язало корпорацію Johnson & Johnson (J&J) виплатити компенсацію в розмірі $40 млн двом жінкам, які стверджували, що тальк у дитячій присипці компанії викликав у них рак ...
Кримінал
У Квінсі (Нью-Йорк) правоохоронці заарештували 13 осіб, підозрюваних у причетності до злочинного угруповання, яке здійснило 319 крадіжок у 128 магазинах Home Depot у 9 штатах. Сума вкрадених товарів склала $2,2 ...