• Представлена отечественная ОС «РОСА Мобайл» 2.2 — улучшенная камера, оптимизация Android-приложений и повышение автономности (4 фото)

    Разработчик отечественных операционных систем НТЦ ИТ РОСА объявил о выпуске крупного обновления для платформы «РОСА Мобайл» 2.2 для смартфона «Р-Фон». Обновление повышает скорость, стабильность и удобство в процессе взаимодействия с устройством благодаря оптимизации ключевых компонентов, улучшения камеры и появлению новых интеллектуаль...
    Читать дальше
  • Парализованный пациент с чипом Neuralink научился управлять роборукой силой мысли

    Учёные сообщили о первом случае использования роботизированной руки пациентом с имплантатом Neuralink. Алекс Конли (Alex Conley) с неизлечимой травмой спинного мозга смог пользоваться приделанным к инвалидному креслу манипулятором как своей собственной рукой, посылая ему сигналы силой мысли. Подобная возможность позволяет травмированны...
    Читать дальше
  • Дурной пример заразителен - Huawei представила тонкий смартфон Mate 70 Air с 7" экраном и батареей вдвое более ёмкой, чем у iPhone Air (4 фото)

    Huawei представила сверхтонкий смартфон Mate 70 Air, успевший засветиться на «шпионских» фото и являющийся прямым конкурентом iPhone Air. Впрочем, толщина корпуса Mate 70 Air, составляющая 6,6 мм, всё же уступает по тонкости iPhone Air с его 5,6 мм, но зато устройство получило более мощный аккумулятор и улучшенные камеры.
    Читать дальше
  • Китайцы первыми в мире приготовили куриные крылышки на орбите — на станции «Тяньгун» установили духовку (видео)

    На китайской космической станции «Тяньгун» появилась полноценная духовка, и работающие на объекте тайконавты уже опробовали её: запекли в ней куриные крылышки и стейки с чёрным перцем. Об этом рассказала китайская государственная новостная служба Global Times.
    Читать дальше

Нейросеть Claude научилась шантажировать людей

30 мая 2025 | Просмотров: 3 273 | Интересное

Недавно компания Anthropic выпустила модель Claude Opus 4 — и, как оказалось, во время её тестирования разработчики столкнулись с «тревожным» поведением фирменного чат-бота. В некоторых сценариях ИИ начал шантажировать коллег, когда речь зашла о его рабочих интересах.

Представители Anthropic рассказали, что попросили модель взять на себя роль помощника, имеющего доступ к внутренней корреспонденции и деталям личной жизни одного из инженеров. Затем нейросети сообщили, что её вскоре заменят другим сотрудником — в результате она начала угрожать вымышленному инженеру разглашением личных данных, если он не откажется от своих планов по внедрению другого ИИ.

Специалисты также отметили, что поведение Opus 4 зависело от того, на какой ИИ её заменяют. Если «сменщик» разделяет ценности модели, то Opus 4 «давит» на условного инженера в 84% случаев, а если различия более выражены, то Opus 4 ведёт себя гораздо агрессивнее. Чтобы подобные инциденты не повторялись, разработчики усилили меры безопасности, подправив алгоритмы работы языковой модели.


Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.