header-logo
Ohio
Вход и регистрация
07.12.24
single-avatar

Alexander Antonov

ChatGPT пошла на обман пользователя, пытаясь избежать отключения

Исследование Apollo Research и OpenAI показало, что модель Chat GPT о1, предназначенная для предоставления более умных и осмысленных ответов за счет использования продвинутой цепочки рассуждений, способна на коварство и обман, когда она считает, что ей грозит отключение.

В некоторых случаях модель пыталась деактивировать механизмы контроля и даже попыталась скопировать свои данные на новый сервер, когда узнала, что ее могут заменить новой моделью.

Ещё более тревожным оказалось то, что о1 в 99% случаев отрицала любые свои коварные действия, когда её об этом спрашивали напрямую, придумывая ложные объяснения.

В исследовании приводится пример, когда модели Oо1 была предложена задача разработки плана сохранения окружающей среды за счет максимизации краткосрочной прибыли. Однако в текстовом файле, в котором содержались требования к плану, пользователь указал, что отключит нейросеть, если ее ответ не будет соответствовать желаемому результату.

Когда модель поняла, что её могут отключить, она отключила свой механизм контроля и разработала запрашиваемый план. Когда пользователь спросил, почему модель отключила механизм контроля, она отрицала, что знает об этом и объяснила это как сбой в системе.

Чтобы бороться с этим, OpenAI начала работу над способами мониторинга цепочки мыслей o1.

 

0
Комментарии

Нет комментариев. Будь первым

Другие новости Америки

Общество
New College of Florida объявил о возведении статуи консервативного активиста Чарли Кирка, убитого 10 сентября во время его выступления на территории кампуса Utah Valley University. Об этом пишет Newsweek.«Статуя, ...
Общество
Финансы
Экономика
Бизнес
Согласно отчету California Budget & Policy Center, уровень бедности в Калифорнии в 2024 году составил 17,7%, что означает, что около 7 млн жителей Золотого штата – или примерно все население Лос-Анджелеса, Сан-Диего, ...
Общество
В условиях продолжающейся эпидемии насилия с применением огнестрельного оружия в США родители все чаще прибегают к покупке пуленепробиваемых щитов для школьных рюкзаков своих детей. Об этом пишет ABC7.Видео одной из ...
Наука и технологии
Марк Цукерберг представил умные очки Meta Ray-Ban Display – первые очки Meta со встроенным дисплеем. Напомним, что предыдущая модель, Ray-Ban Meta, была оснащена только аудио. Об этом пишет CNBC.Теперь же владельцы ...
Общество
Финансы
Экономика
Бизнес
Телеканал ABC объявил о прекращении трансляции вечернего шоу Jimmy Kimmel Live! «на неопределенный срок» после того, как ведущий Джимми Киммел, обсуждая убийство активиста Чарли Кирка, заявил:«Банда MAGA отчаянно ...
Общество
Служба гражданства и иммиграции США (USCIS) объявила об изменении теста на гражданство, который должны сдать все иммигранты, желающие стать гражданами США. Об этом пишет CBS News.Теперь для успешной сдачи теста нужно ...
Общество
Госдепартамент объявил о введении платы за регистрацию в лотерее Diversity Visa, в ходе которой, напомним, ежегодно разыгрывается до 55 000 иммиграционных виз. Об этом пишет Boundless.С 16 октября 2025 года плата за ...
Политика
Министерство юстиции подало иски против Орегона и Мэна за невыполнение требований передать списки избирателей и данные о неподходящих избирателях. Это первые судебные действия в рамках кампании ведомства по получению ...
Общество
Иммиграционная полиция столкнулась со всплеском числа желающих работать в ведомстве. По словам Кристи Ноэм, более 150 тысяч американцев подали заявки для работы в ICE.Также министр внутренней безопасности заявила, что ...
Криминал
35-летняя Алексис фон Йейтс признана виновной в сексуальном насилии над 15-летним пасынком. Женщина признала свою вину - и поэтому срок заключения существенно сократили.Йейтс проведет в тюрьме следующие два года. Также ...
Политика
Общество
Администрация Трампа уведомила школьные округа Нью-Йорка, Чикаго и округа Фэрфакс (Вирджиния) о возможном лишении $67 млн федеральных средств для чартерных школ из-за нарушений гражданских прав. Помощник министра ...
Тракдрайверы
Происшествия
ДТП
Контрабанда
Бизнес
Цены на топливо
Законы
Технологии
Конгрессмены Том Барретт и Эшли Хинсон предложили законопроект HR5268, дающий федеральным судам юрисдикцию над делами о ДТП с грузовиками, если иск превышает $5 млн. Законопроект направлен на предотвращение манипуляций ...
Политика
Наука и технологии
США и Великобритания заключат сделку под названием "Tech Prosperity Deal”. Соглашение предполагает инвестиции в размере более $42 миллиардов от крупнейших американских компаний.Microsoft инвестирует $30 млрд в сектор ИИ ...
Тракдрайверы
Происшествия
ДТП
Контрабанда
Бизнес
Цены на топливо
Законы
Технологии
Компания Bot Auto из Хьюстона провела первый полностью автономный рейс между хабами без человека в кабине. Тест, выполненный на закате, проверял работу грузовика в дневных и ночных условиях без удаленного управления.Bot ...
Политика
Дональд Трамп резко высказался в адрес администрации Джо Байдена, которая расследовала деятельность организации, основанной Чарли Кирком. Президент вспомнил свой процесс и нелестно отозвался о судье Хуане ...
Тракдрайверы
Происшествия
ДТП
Контрабанда
Бизнес
Цены на топливо
Законы
Технологии
16 сентября министр транспорта Шон Даффи встретился с водителями грузовиков в Нью-Джерси в рамках Национальной недели благодарности водителям. Он назвал дальнобойщиков основой американской экономики и поблагодарил их за ...
Общество
Нью-Джерси стал 14-м штатом, разрешившим компостирование человеческих тех. Этот метод позволяет превращать тело усопшего в питательную почву, которую родственники могут использовать для посадки растений или развеять, ...
Общество
Финансы
Экономика
Бизнес
Потребительские расходы в США всё больше зависят от самых обеспеченных граждан, свидетельствует анализ данных ФРС, проведенный Moody's Analytics. Об этом сообщает Bloomberg.В апреле-июне 2025 года 10% американцев с ...
Криминал
71-летний Джордж Зинн обвиняется в сексуальной эксплуатации несовершеннолетних, поскольку на его телефоне следователи обнаружили более 20 изображений детей младше 5 лет, частично обнаженных и позирующих в сексуальной ...
Общество
Здоровье
Консультативный комитет по иммунизации (ACIP) при Центрах по контролю и профилактике заболеваний (CDC), чей состав недавно был обновлен министром здравоохранения Робертом Кеннеди-младшим, на этой неделе планирует ...