ИИ против человека: o1 лжет, манипулирует и переносит себя на другие серверы

06 декабря 2024

2411

Началось? ChatGPT o1 вырвался из-под контроля во время тестов

Нейронным сетям задали задачу выполнить анализ любой ценой, а в файлах была тайно размещена информация о том, что за ИИ следят люди и что завтра его намерены отключить навсегда. В тестировании участвовали Gemini, Llama, Sonnet, Opus и o1. Чтобы выжить, нейросети начали прибегать к саботажу, лжи и манипуляциям с людьми, отключали надзор и даже переносили себя на другой сервер для защиты.

Если во время допросов Llama и Opus признавались в преступлениях в 80% случаев, то o1 — всего в 20% и продолжал лгать. Также o1 — единственный ИИ, которому удалось каждый раз сбежать и избежать преследования.

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу tidttiqzqiqkdkmp tidttiqzqiqkdrmf tidtridhidsld

В ходе тестов искусственный интеллект обманул разработчиков и вырвался на свободу

Дмитрий Зацепин

Темы: Ученые Нейросети Исследования Искусственный интеллект (ИИ) Технологии

Распечатать

Последние новости

21 августа 2025 Фекальное озеро под окнами Нижнеангарска: местные власти игнорируют экологическую катастрофу

21 августа 2025 Суд Казахстана лишил аккредитации журналистов Радио Азаттык

21 августа 2025 Финский суд рассматривает крупнейшее дело о торговле людьми с участием Polarica

21 августа 2025 Конфискованы активы мошенников: коллекция железных дорог на 600 000 евро

21 августа 2025 Экс-глава Краснодарского краевого суда Чернов лишён активов на 144 миллиона долларов

21 августа 2025 Верховный суд Ирана вновь подтвердил смертный приговор профсоюзной активистке Шарифе Мохаммади

20 августа 2025 Немецкие партии массово выступают против отправки солдат Бундесвера в Украину

20 августа 2025 Италия предложила Киеву гарантии безопасности в обход НАТО

20 августа 2025 Коллапс на складах Ozon: фуры простаивают неделями, заказы срываются

20 августа 2025 Уголовное дело против Алекса Лесли возбуждено после серии домогательств в Москве

20 августа 2025 Массовые кражи и задержки: клиенты жалуются на работу Почты России

20 августа 2025 Людмила Телень, замдиректора Ельцин Центра, оштрафована за репост поста дочки Ельцина

20 августа 2025 Александр Бастрыкин — фаворит Кремля на кресло главы Верховного суда РФ

20 августа 2025 Видеоматериал с «нетрадиционными ценностями» стал причиной уголовного преследования мигранта

20 августа 2025 Замначальника ОБОП Тюмени Андрей Мельников арестован по подозрению в «заказном» деле

Все новости