Washington, DC
Вы находитесь в Washington, DC
Продолжить поиск дальше в этой локации?
Изменить
Продолжить
07.12.24
single-avatar

Alexander Antonov

ChatGPT пошла на обман пользователя, пытаясь избежать отключения

Исследование Apollo Research и OpenAI показало, что модель Chat GPT о1, предназначенная для предоставления более умных и осмысленных ответов за счет использования продвинутой цепочки рассуждений, способна на коварство и обман, когда она считает, что ей грозит отключение.

В некоторых случаях модель пыталась деактивировать механизмы контроля и даже попыталась скопировать свои данные на новый сервер, когда узнала, что ее могут заменить новой моделью.

Ещё более тревожным оказалось то, что о1 в 99% случаев отрицала любые свои коварные действия, когда её об этом спрашивали напрямую, придумывая ложные объяснения.

В исследовании приводится пример, когда модели Oо1 была предложена задача разработки плана сохранения окружающей среды за счет максимизации краткосрочной прибыли. Однако в текстовом файле, в котором содержались требования к плану, пользователь указал, что отключит нейросеть, если ее ответ не будет соответствовать желаемому результату.

Когда модель поняла, что её могут отключить, она отключила свой механизм контроля и разработала запрашиваемый план. Когда пользователь спросил, почему модель отключила механизм контроля, она отрицала, что знает об этом и объяснила это как сбой в системе.

Чтобы бороться с этим, OpenAI начала работу над способами мониторинга цепочки мыслей o1.

 

0
Комментарии (0)

Другие новости Америки

Гендиректор Meta Марк Цукерберг объявил, что в этом году его компания планирует инвестировать до $65 млрд в проекты, связанные с искусственным интеллектом: строительство гигантского дата-центра, расширение команды, ... Еще
Сенатор от штата Миссисипи Брэдфорд Блэкмон (демократ) представил законопроект под названием «Contraception Begins at Erection Act», который вызвал бурное обсуждение в интернете.Законопроект предлагает сделать ... Еще
21-летняя Тереза Янгблут обвиняется в убийстве агента Пограничной службы США Дэвида Маланда во время перестрелки на шоссе в Вермонте, недалеко от канадской границы. Инцидент произошел после того, как Маланд остановил ... Еще
Мэр Чикаго Брэндон Джонсон отмахнулся от угрозы федеральных чиновников о возможном аресте за несоблюдение приказов президента Дональда Трампа по проведению массовых депортаций нелегальных иммигрантов. В интервью для ... Еще
59 голосами против 34 Сенат утвердил кандидатуру губернатора Южной Дакоты, Кристи Ноем, на должность министра внутренней безопасности.53-летняя Ноем будет отвечать за работу Погранично-таможенной службы США, Секретной ... Еще
Министерство внутренней безопасности (DHS) приостановило ряд программ, которые позволяли иммигрантам временно проживать в США, включая программу для украинцев Uniting for Ukraine, благодаря которой по состоянию на ... Еще
Государственный секретарь Марко Рубио распорядился о немедленном прекращении финансирования почти всех программ иностранной помощи США, за исключением военной поддержки Израиля и Египта.Указ Рубио будет действовать в ... Еще
Член палаты представителей Энди Оглз (республиканец от Теннесси) внес предложение о внесении изменений в 22-ю поправку Конституции США, чтобы позволить президенту Дональду Трампу и будущим президентам избираться на ... Еще
Уходящий в отставку премьер-министр Канады Джастин Трюдо выразил беспокойство по поводу планов президента США Дональда Трампа ввести 25%-ные тарифы на канадские товары.Трюдо заявил, что тарифы приведут к повышению цен ... Еще
Президент Дональд Трамп подписал исполнительный указ, который запрещает содержание трансгендерных женщин в женских тюрьмах на федеральном уровне.Указ также предписывает прекратить финансирование медицинских процедур для ... Еще
Дональд Трамп провел «жесткий» телефонный разговор с премьер-министром Дании Метте Фредериксен, во время которого он подчеркнул свое серьезное намерение сделать Гренландию частью Соединённых Штатов.Европейские ... Еще
Во время своего визита в районы, пострадавшие от урагана Helene в Северной Каролине, президент Дональд Трамп заявил о планах реформировать или даже ликвидировать Федеральное агентство по управлению в чрезвычайных ... Еще
Министерство внутренней безопасности США (DHS) разрешило Иммиграционной и таможенной полиции (ICE) ускоренно депортировать мигрантов, которые получили временное разрешение на въезд в стране благодаря программам ... Еще
Согласно новому исследованию, использование смартфонов печально сказывается на психическом здоровье детей от 13 лет. Они становятся более агрессивными, оторванными от реальности, а также у школьников часто бывают ... Еще
Глава РФ выразил готовность встретиться с Дональдом Трампом для обсуждения войны в Украине. Владимир Путин заявил, что США должны надавать на Владимира Зеленского, чтобы тот отменил указ, запрещающий переговоры с ... Еще
Авария произошла 20 января на заводе Warrenton Steel в Уоррентоне на Veterans Memorial Parkway рядом с I-70.60-летний дальнобойщик ехал на восток, когда ошибся на повороте шоссе. Грузовик съехал с дороги, пересек ... Еще
Пресс-секретарь Белого дома Кэролайн Ливитт объявила о начале “депортационных рейсов”. Задержанных нелегальных мигрантов начали отправлять на родину."Президент Трамп посылает всему миру четкий и ясный сигнал: если вы ... Еще
Компания вновь открыла пару терминалов в Пенсильвании, которые частный LTL-перевозчик приобрел на аукционе недвижимости в связи с банкротством Yellow в 2023 году.Объекты в Кэмп-Хилле и Эри входят в число четырех ... Еще
Трагедия случилась еще два года назад, но только сейчас 35-летней Джессике Уивер предъявили уголовные обвинения. Женщину обвиняют в гибели ее 3-летнего сына Энтони.Уивер пришла с сыном в аквапарк Camp Cohen в Эль-Пасо ... Еще
Дональд Трамп уверен в своих возможностях заключить сделки с Китаем и Тайванем. Об этом он заявил в интервью Шону Хэннити.По его словам, у США есть то, что необходимо Китаю, - “горшок с золотом”. Президент уверен, что ... Еще