• MacBook Pro на чипе M6 получит самое значимое обновление за последние годы

    Журналист Bloomberg Марк Гурман опубликовал свежие инсайдерские подробности о предстоящей модели MacBook Pro на базе процессора M6. По его словам, лэптоп ждут заметные изменения в сравнении с моделями предыдущих годов.
    Читать дальше
  • Новая атака AirSnitch позволяет перехватывать трафик в любой сети Wi-Fi без взлома

    Группа экспертов в области кибербезопасности опубликовала работу, посвящённую методу атаки AirSnitch, которая осуществляется на сети Wi-Fi. Действуя на двух нижних уровнях беспроводной сети, она не взламывает шифрование данных, а позволяет его обходить, перехватывать трафик и производить подмену данных.
    Читать дальше
  • Флагманы Galaxy S26 и S26+ получили минимальные улучшения и цену от 90 000 рублей (5 фото)

    Помимо старшей модели Galaxy S26 Ultra компания Samsung сегодня представила более компактные и доступные флагманские смартфоны Galaxy S26 и Galaxy S26+. Между собой новинки отличаются в первую очередь размерами экранов и ёмкостью батарей.
    Читать дальше
  • Google пообещала добавить «удивительные вещи» в Android 17

    На прошедшем на этой неделе мероприятии Galaxy Unpacked, помимо презентации новинок от Samsung, стали известны некоторые подробности о том, что Google планирует реализовать в операционной системе Android. Ими поделился президент по экосистеме Android Самир Самат, намекнувший на «удивительные вещи» в Android 17.
    Читать дальше
  • Марсоход NASA Curiosity показал странную «паутину» на поверхности Марса — ранее её обнаружили с орбиты (2 фото)

    Марсоход NASA Curiosity уже около шести месяцев исследует необычный район на горе Эолида (Mount Sharp по неофициальной классификации NASA) в кратере Гейла. Здесь поверхность покрыта так называемыми boxwork-структурами — низкими грядами высотой 1–2 метра, между которыми находятся песчаные впадины. С орбиты эти образования выглядят как г...
    Читать дальше

Нейросеть Claude научилась шантажировать людей

30 мая 2025 | Просмотров: 3 490 | Интересное

Недавно компания Anthropic выпустила модель Claude Opus 4 — и, как оказалось, во время её тестирования разработчики столкнулись с «тревожным» поведением фирменного чат-бота. В некоторых сценариях ИИ начал шантажировать коллег, когда речь зашла о его рабочих интересах.

Представители Anthropic рассказали, что попросили модель взять на себя роль помощника, имеющего доступ к внутренней корреспонденции и деталям личной жизни одного из инженеров. Затем нейросети сообщили, что её вскоре заменят другим сотрудником — в результате она начала угрожать вымышленному инженеру разглашением личных данных, если он не откажется от своих планов по внедрению другого ИИ.

Специалисты также отметили, что поведение Opus 4 зависело от того, на какой ИИ её заменяют. Если «сменщик» разделяет ценности модели, то Opus 4 «давит» на условного инженера в 84% случаев, а если различия более выражены, то Opus 4 ведёт себя гораздо агрессивнее. Чтобы подобные инциденты не повторялись, разработчики усилили меры безопасности, подправив алгоритмы работы языковой модели.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.