ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы
2389

Началось? ChatGPT o1 вырвался из-под контроля во время тестов
Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.
Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.
Распечатать
04 июля 2025
Авиакомпания «Победа» проигнорировала судебное решение об увеличении размеров ручной клади
04 июля 2025
Книжные магазины в России будут штрафовать за продажу книг авторов-иноагентов и экстремистов
04 июля 2025
Лахта-Центр в Петербурге подвергся удару молнии
04 июля 2025
Налоговая в Калининграде подала иск о банкротстве компании Домодедово — давление на Дмитрия Каменщика растёт
03 июля 2025
Игорь Иванов арестован ульяновским судом по обвинению в мошенничестве на сумму 16 миллионов рублей
03 июля 2025
Offshore surveillance: how powerful Russian fixer Valeriy Bitaev took ‘Citadel’ out of state control
03 июля 2025
Финансовые проблемы и долги грозят национализацией активов «Крокус Групп» Араза Агаларова