header-logo
Вхід і реєстрація
07.12.24
single-avatar

Alexander Antonov

ChatGPT пішла на обман користувача, намагаючись уникнути відключення

Дослідження Apollo Research та OpenAI показало, що модель Chat GPT о1, призначена для надання розумніших і осмислених відповідей за рахунок використання просунутого ланцюжка міркувань, здатна на підступність і обман, коли вона вважає, що їй загрожує відключення.

У деяких випадках модель намагалася деактивувати механізми контролю і навіть спробувала скопіювати свої дані на новий сервер, коли дізналася, що її можуть замінити на нову модель.

У 99% випадків о1 заперечувала будь-які свої підступні дії, коли її про це запитували безпосередньо, часто вигадуючи хибні пояснення.

У дослідженні наводиться приклад, коли моделі о1 було запропоновано завдання розробки плану збереження навколишнього середовища за рахунок максимізації короткострокового прибутку. Однак у текстовому файлі, в якому містилися вимоги до плану, користувач вказав, що відключить нейромережу, якщо її відповідь не відповідатиме бажаному результату.

Коли модель зрозуміла, що її можуть відключити, вона відключила свій механізм контролю і розробила потрібний план. Коли користувач спитав, чому модель відключила механізм контролю, вона заперечувала, що знає про це і пояснила це як збій у системі.

Щоб боротися з цим, OpenAI розпочала роботу над способами моніторингу ланцюжка думок o1.

 

0
Коментарі

Коментарів немає. Будьте першим

Інші новини Америки

Спільнота
Національна асоціація освіти (NEA), найбільша профспілка США з понад 3 мільйонами членів, провела конференцію «Просування справедливості для ЛГБТК+». Захід включав навчання неопрономам (новим ЛГБТ-займенникам) і ...
Політика
Державний секретар США Марко Рубіо заявив, що не буде претендувати на президентську номінацію від республіканців у 2028 році, якщо за неї боротиметься віцепрезидент Джей Ді Венс. Він підкреслив, що в такому випадку саме ...
Політика
Дональд Трамп заснував медаль за оборону мексиканського кордону і вчора нагородив нею американських військовослужбовців. Ця нагорода відзначає захист південного кордону США і збереження суверенітету країни.Під ...
ФінансиБізнес
Статки Ілона Маска досягли $677 мільярдів. Він став першою людиною в історії, чиє багатство перевищило $600 мільярдів - і навіть $500 мільярдів раніше не досягав ніхто. Зростання на $168 мільярдів відбулося завдяки ...
ФінансиЕкономіяБізнес
Звіт по зайнятості показав, що в листопаді економіка США додала 64 тисячі робочих місць поза сектором сільського господарства. Як і в попередні місяці, сектор охорони здоров'я склав левову частку найму, додавши 46 тисяч ...
Політика
Дональд Трамп подав позов про наклеп проти британської корпорації BBC на суму $5 мільярдів. Позов пов'язаний з редагуванням його промови від 6 січня 2021 року в документальній програмі Panorama.У програмі монтаж створив ...
ФінансиБізнесКримінал
Платформа SafelyHQ зібрала понад 50 тисяч перевірених скарг від жертв онлайн-шахрайства, і в 85% випадків, де вказано джерело, згадується Facebook. Це значно перевищує частку інших платформ, таких як Instagram, Google, ...
ПолітикаНовини світу
У суботу Ізраїль завдав удару в місті Газа, в результаті якого загинув Раед Саад - заступник командира військового крила ХАМАС і один з імовірних організаторів різанини 7 жовтня. Всього в атаці загинули чотири людини, ...
Кримінал
18-річний Мухаммад Умурзоков став другою жертвою стрілянини в університеті Брауна. Він був талановитим і перспективним студентом на стипендії, який мріяв стати нейрохірургом, заявили родичі. Сім'я Мухаммада приїхала до ...
ПолітикаФінансиЕкономіяБізнес
Дональд Трамп забезпечив угоду щодо критичних мінералів, яка зміцнює національну безпеку США і знижує залежність від іноземних ланцюгів поставок, заявив міністр торгівлі Говард Лютник. Міністр оголосив про велику угоду ...
ПолітикаВійна в Україні
Другий раунд переговорів між українською делегацією та американськими посланцями Стівом Віткоффом і Джаредом Кушнером відбувся сьогодні в Берліні за участю Володимира Зеленського. Як повідомляють джерела, Дональд Трамп ...
ПодіїПоліцейські хроніки
Роб Рейнер і його дружина Мішель були зарізані у своєму будинку в Лос-Анджелесі. Тіла з перерізаними горлами виявила їхня дочка Ромі.32-річний син пари Нік Рейнер взятий під варту за звинуваченням у вбивстві і перебуває ...
Кримінал
ФБР заарештувало чотирьох ймовірних членів екстремістської групи Turtle Island Liberation Front в Лусерн-Веллі, де вони готувалися випробувати саморобні вибухові пристрої. Організація дотримується антиурядових і ...
ЗіркиПодіїПоліцейські хроніки
Актор і режисер Роб Рейнер разом з дружиною Мішель Рейнер знайдені мертвими в своєму будинку в районі Брентвуд Лос-Анджелеса. Їх знайшла дочка, яка викликала екстрені служби. Смерті розслідуються як вбивство: вже ...
Новини світу
У неділю батько і син атакували святкування Хануки на пляжі Бонді в Сіднеї, вбивши 15 осіб. У лікарнях опинилися 40 осіб, включаючи тяжко поранених.Нападниками виявилися 50-річний Саджит Акрам, який приїхав до Австралії ...
ПодіїПоліцейські хроніки
Елла Кук, студентка другого курсу університету Брауна, стала однією з двох студентів, застрелених під час сесії підготовки до іспитів у суботу вдень. Вона була віце-президентом клубу республіканців університету, родом з ...
Спільнота
Округ Сан-Дієго розмістив на сайті слайд-шоу «Терміни LGBTQIA+, які потрібно знати», де описано дев'ять гендерних ідентичностей, включаючи трансгендер, нон-бінарний і гендерфлюїд. У матеріалах також представлена ...
Новини світу
Нападниками на святкування Хануки на пляжі Бонді виявилися 24-річний Навід Акрам і його 50-річний батько. Вони відкрили вогонь з рушниць і гвинтівки. Батько був убитий у перестрілці з поліцією на місці, а Навід Акрам ...
ПодіїПоліцейські хроніки
6-річна дівчинка з Нью-Гемпшира була госпіталізована після того, як з'їла цукерку з ТГК (психоактивна речовина в канабісі). У лікарні аналіз показав позитивний результат на канабіноїди та кокаїн.30-річну Пейдж Гуле ...
ПолітикаВійна в Україні
Володимир Зеленський оголосив про відмову від мети вступу до НАТО в обмін на гарантії безпеки від США, Європи та інших партнерів. Він назвав це компромісом з боку України і зажадав, щоб гарантії були юридично ...