• Вышло приложение XChat - защищённый мессенджер от Илона Маска

    Компания X, принадлежащая Илону Маску, выпустила мессенджер XChat в виде отдельного приложения. Менее чем за сутки программа вошла в топ бесплатных приложений App Store сразу в ряде стран, а в некоторых регионах и вовсе поднялась на первое место.
    Читать дальше
  • GPT-5.2 обошла абитуриентов, сдав вступительные экзамены в Токийский и Киотский университеты лучше всех

    Нейросеть GPT-5.2 в режиме размышления получила высшие баллы на вступительных экзаменах в Токийском и Киотском университетах Японии, опередив реальных абитуриентов этого года. Компания LifePrompt, проводившая тесты, сообщила, что нейросеть превзошла максимальные проходные результаты даже на самых конкурентных медицинских направлениях.
    Читать дальше
  • СМИ: на майские праздники планируются масштабные отключения мобильного интернета

    В Москве на майские праздники могут вновь ограничить работу мобильного интернета. По данным издания «Коммерсантъ» со ссылкой на источники в телеком-отрасли, отключения будут происходить на протяжении нескольких дней из соображений безопасности.
    Читать дальше
  • Большой ящик на колёсах: Humble Robotics представил беспилотный грузовик без кабины с запасом хода в 320 км

    Калифорнийский стартап Humble Robotics вышел из режима закрытой разработки, представив электрический грузовик класса 8 без водительской кабины. Компания позиционирует своё изобретение как автономную платформу, способную значительно снизить затраты и повысить эффективность в индустрии грузоперевозок, объём которых составляет примерно $9...
    Читать дальше
  • Опасная уязвимость обнаружена в большинстве дистрибутивов Linux: 732 байта кода откроют любому root-права

    Разработчики основанного на алгоритмах искусственного интеллекта средства безопасности Xint Code обнаружили в ядре Linux и, соответственно, в большинстве популярных дистрибутивов опасную уязвимость, которая получила название Copy Fail и номер CVE-2026-31431. Эксплуатируя эту уязвимость, любой пользователь без особых привилегий может по...
    Читать дальше

Нейросеть Claude научилась шантажировать людей

30 мая 2025 | Просмотров: 3 590 | Интересное

Недавно компания Anthropic выпустила модель Claude Opus 4 — и, как оказалось, во время её тестирования разработчики столкнулись с «тревожным» поведением фирменного чат-бота. В некоторых сценариях ИИ начал шантажировать коллег, когда речь зашла о его рабочих интересах.

Представители Anthropic рассказали, что попросили модель взять на себя роль помощника, имеющего доступ к внутренней корреспонденции и деталям личной жизни одного из инженеров. Затем нейросети сообщили, что её вскоре заменят другим сотрудником — в результате она начала угрожать вымышленному инженеру разглашением личных данных, если он не откажется от своих планов по внедрению другого ИИ.

Специалисты также отметили, что поведение Opus 4 зависело от того, на какой ИИ её заменяют. Если «сменщик» разделяет ценности модели, то Opus 4 «давит» на условного инженера в 84% случаев, а если различия более выражены, то Opus 4 ведёт себя гораздо агрессивнее. Чтобы подобные инциденты не повторялись, разработчики усилили меры безопасности, подправив алгоритмы работы языковой модели.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.