header-logo
Alexandria, VA
Вход и регистрация
07.12.24
single-avatar

Alexander Antonov

ChatGPT пішла на обман користувача, намагаючись уникнути відключення

Дослідження Apollo Research та OpenAI показало, що модель Chat GPT о1, призначена для надання розумніших і осмислених відповідей за рахунок використання просунутого ланцюжка міркувань, здатна на підступність і обман, коли вона вважає, що їй загрожує відключення.

У деяких випадках модель намагалася деактивувати механізми контролю і навіть спробувала скопіювати свої дані на новий сервер, коли дізналася, що її можуть замінити на нову модель.

У 99% випадків о1 заперечувала будь-які свої підступні дії, коли її про це запитували безпосередньо, часто вигадуючи хибні пояснення.

У дослідженні наводиться приклад, коли моделі о1 було запропоновано завдання розробки плану збереження навколишнього середовища за рахунок максимізації короткострокового прибутку. Однак у текстовому файлі, в якому містилися вимоги до плану, користувач вказав, що відключить нейромережу, якщо її відповідь не відповідатиме бажаному результату.

Коли модель зрозуміла, що її можуть відключити, вона відключила свій механізм контролю і розробила потрібний план. Коли користувач спитав, чому модель відключила механізм контролю, вона заперечувала, що знає про це і пояснила це як збій у системі.

Щоб боротися з цим, OpenAI розпочала роботу над способами моніторингу ланцюжка думок o1.

 

0
Коментарі

Коментарів немає. Будьте першим

Другие новости Америки

Спільнота
New College of Florida оголосив про зведення статуї консервативного активіста Чарлі Кірка, убитого 10 вересня під час його виступу на території кампусу Utah Valley University. Про це пише Newsweek.«Статуя, будівництво ...
Спільнота
Фінанси
Економія
Бізнес
Згідно зі звітом California Budget & Policy Center, рівень бідності в Каліфорнії у 2024 році становив 17,7%, що означає, що близько 7 млн жителів Золотого штату – або приблизно все населення Лос-Анджелеса, Сан-Дієго, ...
Спільнота
В умовах триваючої епідемії насильства із застосуванням вогнепальної зброї в США батьки все частіше вдаються до придбання куленепробивних щитів для шкільних рюкзаків своїх дітей. Про це пише ABC7.Відео однієї з мам, ...
Наука і технології
Марк Цукерберг представив розумні окуляри Meta Ray-Ban Display – перші окуляри Meta з вбудованим дисплеєм. Нагадаємо, що попередня модель, Ray-Ban Meta, була оснащена лише аудіо. Про це пише CNBC.Тепер же власники ...
Спільнота
Фінанси
Економія
Бізнес
Телеканал ABC оголосив про припинення трансляції вечірнього шоу Jimmy Kimmel Live! «на невизначений термін» після того, як ведучий Джиммі Кіммел, обговорюючи вбивство активіста Чарлі Кірка, заявив:«Банда MAGA ...
Спільнота
Служба громадянства та імміграції США (USCIS) оголосила про зміну тесту на громадянство, який мають скласти всі іммігранти, що бажають стати громадянами США. Про це пише CBS News.Тепер для успішного складання тесту ...
Спільнота
Держдепартамент оголосив про введення плати за реєстрацію в лотереї Diversity Visa, у рамках якої, нагадаємо, щорічно розігрується до 55 000 імміграційних віз. Про це пише Boundless.З 16 жовтня 2025 року плата за ...
Політика
Міністерство юстиції подало позови проти Орегона і Мена за невиконання вимог передати списки виборців і дані про невідповідних виборців. Це перші судові дії в рамках кампанії відомства з отримання деталізованих даних ...
Спільнота
Імміграційна поліція зіткнулася зі сплеском кількості охочих працювати у відомстві. За словами Крісті Ноем, понад 150 тисяч американців подали заявки для роботи в ICE.Також міністр внутрішньої безпеки заявила, що 18 ...
Кримінал
35-річна Алексіс фон Єйтс визнана винною в сексуальному насильстві над 15-річним пасинком. Жінка визнала свою провину - і тому термін ув'язнення суттєво скоротили.Єйтс проведе у в'язниці наступні два роки. Також її ...
Політика
Спільнота
Адміністрація Трампа повідомила шкільні округи Нью-Йорка, Чикаго та округу Ферфакс (Вірджинія) про можливе позбавлення $67 млн федеральних коштів для чартерних шкіл через порушення громадянських прав. Помічник міністра ...
Політика
Наука і технології
США і Велика Британія укладуть угоду під назвою "Tech Prosperity Deal". Угода передбачає інвестиції в розмірі понад $42 мільярди від найбільших американських компаній.Microsoft інвестує $30 млрд у сектор ШІ Великої ...
Політика
Дональд Трамп різко висловився на адресу адміністрації Джо Байдена, яка розслідувала діяльність організації, заснованої Чарлі Кірком. Президент згадав свій процес і невтішно відгукнувся про суддю Хуана Мерчана. "Чому ...
Спільнота
Нью-Джерсі став 14-м штатом, що дозволив компостування людських тіл. Цей метод дозволяє перетворювати тіло померлого на поживну землю, яку родичі можуть використовувати для саджання рослин або розвіяти, подібно до ...
Спільнота
Фінанси
Економія
Бізнес
Споживчі витрати в США все більше залежать від найзабезпеченіших громадян, свідчить аналіз даних ФРС, проведений Moody's Analytics. Про це повідомляє Bloomberg.У квітні-червні 2025 року 10% американців з найвищим ...
Кримінал
71-річного Джорджа Зінна звинувачують у сексуальній експлуатації неповнолітніх, оскільки на його телефоні слідчі виявили понад 20 зображень дітей віком до 5 років, частково оголених і позуючих у сексуальній манері.«Зінн ...
Спільнота
Здоров'я
Консультативний комітет з імунізації (ACIP) при Центрах з контролю та профілактики захворювань (CDC), чий склад нещодавно було оновлено міністром охорони здоров'я Робертом Кеннеді-молодшим, цього тижня планує ...
Кримінал
Тайлеру Робінсону, обвинуваченому у вбивстві Чарлі Кірка, сьогодні офіційно висунено обвинувачення у скоєнні низки злочинів, зокрема у тяжкому вбивстві. Прокурори заявили, що мають намір домагатися для нього смертної ...
Політика
Губернатор Міннесоти Тім Волз, кандидат у віцепрезиденти від Демократичної партії на виборах 2024 року, оголосив про намір провести третій термін на посаді лідера штату."Ми досягли історичного прогресу в нашому штаті, ...
Наука і технології
Кримінал
26-річний кенієць Дункан Окіндо був обманом заманений до Таїланду обіцянкою роботи в службі підтримки, але опинився в шахрайському комплексі KK Park на кордоні М'янми. Там він і сотні інших примушених працівників ...