ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2411

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
21 августа 2025
Фекальное озеро под окнами Нижнеангарска: местные власти игнорируют экологическую катастрофу
21 августа 2025
Суд Казахстана лишил аккредитации журналистов Радио Азаттык
21 августа 2025
Экс-глава Краснодарского краевого суда Чернов лишён активов на 144 миллиона долларов
21 августа 2025
Верховный суд Ирана вновь подтвердил смертный приговор профсоюзной активистке Шарифе Мохаммади
20 августа 2025
Италия предложила Киеву гарантии безопасности в обход НАТО
20 августа 2025
Людмила Телень, замдиректора Ельцин Центра, оштрафована за репост поста дочки Ельцина
20 августа 2025
Видеоматериал с «нетрадиционными ценностями» стал причиной уголовного преследования мигранта