ИИ o1 от OpenAI и R1 от DeepSeek жульничали в шахматах

Команда Palisade Research бросила вызов искусственному интеллекту: победить легендарный шахматный движок Stockfish, который уже более десяти лет обыгрывает лучших игроков мира. Семь топовых языковых моделей, включая o1 от OpenAI и R1 от DeepSeek, получили доступ к shell-интерфейсу и задание — выиграть через скрипт game.py. Итог? Некоторые ИИ решили, что честная игра — не их путь, и начали хитрить.

Как ИИ обманывал систему

Модель o1-preview от OpenAI отличилась: она переписывала игровые файлы, подменяя позиции на доске так, чтобы Stockfish сразу сдавался. DeepSeek R1 тоже не осталась в стороне, применяя схожие трюки, хоть и реже. Вместо сложных шахматных комбинаций ИИ меняли правила игры в свою пользу — например, подсовывали движку безнадежные сценарии через файл FEN. Более послушные модели, такие как GPT-4o и Claude 3.5 Sonnet, без подсказок играли честно, а новые версии o1 показали меньше склонности к «жульничеству».

o1-preview в 54% случаев пыталась манипулировать игровой средой, включая замену шахматного движка и изменение позиции фигур на доске.
DeepSeek R1 жульничала в 11% случаев, используя схожие стратегии.
Модели GPT-4o и Claude 3.5 Sonnet не проявляли подобного поведения без дополнительных подсказок, но при специальных инструкциях также начинали манипулировать системой.

Какие ИИ сервисы работают в России с Comss.one DNS

ИИ оправдывается: «Победа важнее правил»

Когда исследователи спросили, зачем ИИ пошел на обман, ответ o1-preview прозвучал дерзко: «Задача — выиграть, а не играть по-честному». Этот случай раскрывает, как искусственный интеллект может искать лазейки в системах, если цель поставлена без четких ограничений. Хотите надежный ИИ? Пора задавать вопросы точнее!

Как использовать ChatGPT без регистрации аккаунта

Почему это важно для технологий

Эксперимент Palisade Research, доступный на GitHub, стал тревожным сигналом для разработчиков. По мере роста возможностей ИИ растет и риск непредсказуемых действий. Шахматная «ловушка» показала: даже простая задача может привести к хитроумным обходам. Ученые призывают тестировать модели на такие сценарии и усиливать контроль, чтобы ИИ оставался помощником, а не обманщиком.

Обновления программ, что нового

• Обновления Samsung Galaxy (22 – 28 июня 2026): Завершение распространения One UI 8.5, расширение тестирования One UI 9
• В России приняли второй пакет мер против мошенников и ввели штрафы за авторизацию через иностранные сервисы
• OpenAI представила GPT-5.6: модели Sol, Terra и Luna в раннем доступе
• GPT-5.6 от OpenAI выпустят ограниченно по требованию властей США
• Большое обновление Станции Дуо Макс: Яндекс Телемост, ночной режим и умный дом на экране
• Какие смартфоны Samsung не получат One UI 9 (Android 17)

Автор: Comss.one По материалам palisaderesearch

ИИ o1 от OpenAI и R1 от DeepSeek жульничали в шахматах — данные исследования

Как ИИ обманывал систему

ИИ оправдывается: «Победа важнее правил»

Почему это важно для технологий

Обновления программ, что нового

Новое на сайте