• Складной iPhone Fold будет дешевле, чем ожидалось — Apple нашла способ сэкономить

    Согласно прогнозам аналитиков, Apple выпустит свой первый складной смартфон с предварительным названием iPhone Fold во второй половине 2026 года. Ожидается, что это будет самый дорогой iPhone в истории компании, но, как утверждает авторитетный аналитик Мин-Чи Куо, его стоимость будет немного ниже, чем предполагалось ранее, благодаря зн...
    Читать дальше
  • В США появилась школа с ИИ вместо учителей

    В частной школе Alpha в Остине, штат Техас, дети учатся без учителей в привычном смысле, поскольку занятия ведёт искусственный интеллект. Новый эксперимент уже вызвал интерес Министерства образования США.
    Читать дальше
  • Запрет установки Windows 11 с локальным аккаунтом не сработал — пользователи нашли новые обходные пути (3 фото)

    Компания Microsoft продолжает бороться с обходными путями, с помощью которых пользователи могут создать локальную учётную запись в Windows 11 и установить операционную систему без подключения к интернету. В новых бета-версиях ОС разработчики заблокировали один из таких способов.
    Читать дальше
  • Google Pixel 10 Pro Fold сгорел во время испытаний на прочность (видео)

    Ожидалось, что смартфон Google Pixel 10 Pro Fold станет новой вехой в развитии складных устройств: первый в истории смартфон с полной защитой от пыли по стандарту IP68, обновлённый дизайн шарнирного механизма и более ёмкая батарея с поддержкой технологии зарядки Qi2. Однако недавний тест Pixel 10 Pro Fold на прочность, проведённый YouT...
    Читать дальше
  • Valve запустила массовое производство VR-гарнитуры Steam Frame — анонс ожидается до конца года

    Компания Valve приступила к массовому производству гарнитуры виртуальной реальности Valve Index 2, которая, по утверждению аналитиков, будет выпущена на рынок в текущем году. Старт продаж запланирован на праздничный сезон, а ориентировочный годовой объём производства составит от 400 000 до 600 000 единиц.
    Читать дальше

Нейросеть Claude научилась шантажировать людей

30 мая 2025 | Просмотров: 3 235 | Интересное

Недавно компания Anthropic выпустила модель Claude Opus 4 — и, как оказалось, во время её тестирования разработчики столкнулись с «тревожным» поведением фирменного чат-бота. В некоторых сценариях ИИ начал шантажировать коллег, когда речь зашла о его рабочих интересах.

Представители Anthropic рассказали, что попросили модель взять на себя роль помощника, имеющего доступ к внутренней корреспонденции и деталям личной жизни одного из инженеров. Затем нейросети сообщили, что её вскоре заменят другим сотрудником — в результате она начала угрожать вымышленному инженеру разглашением личных данных, если он не откажется от своих планов по внедрению другого ИИ.

Специалисты также отметили, что поведение Opus 4 зависело от того, на какой ИИ её заменяют. Если «сменщик» разделяет ценности модели, то Opus 4 «давит» на условного инженера в 84% случаев, а если различия более выражены, то Opus 4 ведёт себя гораздо агрессивнее. Чтобы подобные инциденты не повторялись, разработчики усилили меры безопасности, подправив алгоритмы работы языковой модели.


Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.