• Путин подписал закон о штрафах за поиск экстремистского контента, передачу аккаунтов и рекламу VPN

    Владимир Путин подписал закон, который предусматривает введение штрафов за преднамеренный поиск экстремистских материалов в интернете. Кроме того, подписаны нормы, которые будут квалифицировать применения VPN при совершении преступлений как отягчающего обстоятельства. Наконец, подписан закон, запрещающий рекламу VPN-сервисов.
    Читать дальше
  • Астрономы обнаружили потенциально обитаемую планету «недалеко» от Земли (2 фото + видео)

    Астрономы обнаружили новую экзопланету HD 20794 d, классифицированную как суперземля и расположенную в 19,6 светового года от нас. Планета находится в обитаемой зоне своей звезды, что предполагает возможность наличия жидкой воды на её поверхности.
    Читать дальше
  • Летающий байк Volonaut на реактивной тяге показали в деле (2 фото + видео)

    Ещё в мае этого года видео с летающим на небесном байке штурмовиком стало вирусным. Оно разделило зрителей на скептиков и энтузиастов: первые говорили о «мультике» нейросети, а вторые сразу влюбились в проект. Сегодня появились кадры реальных испытаний воздушного байка Volonaut с настоящим звуковым сопровождением — без бравурной музыки...
    Читать дальше
  • Макеты всех версий iPhone 17 показались на фото в новых цветах (4 фото)

    Инсайдеры продолжают раскрывать подробности о предстоящей линейке iPhone 17, и на этот раз в Сеть попали изображения макетов всех моделей в полной цветовой гамме. Фотографии, опубликованные пользователем Сонни Диксоном, известным своими достоверными утечками о новинках Apple, демонстрируют варианты расцветок для iPhone 17, iPhone 17 Ai...
    Читать дальше
  • NASA обнаружило «элементы жизни» в образцах астероида Бенну (2 фото)

    Учёные NASA проанализировали образцы, собранные с астероида Бенну в ходе миссии OSIRIS-REx, и нашли в них органические соединения, играющие важную роль в происхождении жизни. В частности, были обнаружены фундаментальные элементы, необходимые для синтеза белков и формирования ДНК.
    Читать дальше

Нейросеть Claude научилась шантажировать людей

30 мая 2025 | Просмотров: 3 088 | Интересное

Недавно компания Anthropic выпустила модель Claude Opus 4 — и, как оказалось, во время её тестирования разработчики столкнулись с «тревожным» поведением фирменного чат-бота. В некоторых сценариях ИИ начал шантажировать коллег, когда речь зашла о его рабочих интересах.

Представители Anthropic рассказали, что попросили модель взять на себя роль помощника, имеющего доступ к внутренней корреспонденции и деталям личной жизни одного из инженеров. Затем нейросети сообщили, что её вскоре заменят другим сотрудником — в результате она начала угрожать вымышленному инженеру разглашением личных данных, если он не откажется от своих планов по внедрению другого ИИ.

Специалисты также отметили, что поведение Opus 4 зависело от того, на какой ИИ её заменяют. Если «сменщик» разделяет ценности модели, то Opus 4 «давит» на условного инженера в 84% случаев, а если различия более выражены, то Opus 4 ведёт себя гораздо агрессивнее. Чтобы подобные инциденты не повторялись, разработчики усилили меры безопасности, подправив алгоритмы работы языковой модели.


Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.