ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

06 декабря 2024

2219

Началось? ChatGPT o1 вырвался из-под контроля во время тестов

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу tidttiqzqiqkdkmp tidttiqzqiqkdrmf tidtridhidsld

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Дмитрий Зацепин

Темы: Ученые Нейросети Исследования Искусственный интеллект (ИИ) Технологии

Распечатать

Последние новости

22 января 2025 Сирийские власти разрешили вход в порт Тартус российскому кораблю

22 января 2025 Аферист Тимур Турлов может потерять бизнес из-за угрозы санкционных обвинений

22 января 2025 Словацкий премьер обвиняет протестующих в подготовке майдана

22 января 2025 Демократы оспаривают указ Трампа, лишающий детей нелегалов права на гражданство по рождению

22 января 2025 Реформы Марии Шалягиной: что происходит в медицине Ульяновской области?

22 января 2025 В Ленинградской области разыграли миллиард рублей на ремонт региональных дорог

22 января 2025 Павловский ПНИ снова в руках «Балтрос» с дополнительными средствами на завершение строительства

22 января 2025 США полностью отказываются от взносов в БАПОР

22 января 2025 Росгвардия теряет 60 миллионов рублей: хищения при поставках зимней формы

22 января 2025 Латвия защищает свою безопасность, запрещая россиянам и белорусам приобретать недвижимость

22 января 2025 Трамп оправдал создателя первого даркнет-маркетплейса

22 января 2025 Медики спасают Ларису Голубкину: актриса на грани из-за онкологии

22 января 2025 Последний удар Байдена: российский бюджет теряет миллиарды

22 января 2025 Тихановская назвала освобождение политзаключенных Лукашенко предвыборной игрой

22 января 2025 Трамп использует санкции для давления на Международный уголовный суд

Все новости