• Роботы Figure AI больше недели сортируют посылки в прямом эфире — зрители делают ставки на их поломку (видео)

    Стартап в области робототехники Figure AI уже больше недели ведёт прямую трансляцию, на которой человекоподобные роботы помещают тысячи посылок на конвейерную ленту. В эфире появлялось руководство компании, а в какой-то момент с роботами состязался и человек.
    Читать дальше
  • Астрономы нашли «умеренный Сатурн» почти с земным климатом, а «Уэбб» впервые детально изучил его атмосферу

    Учёные из США провели уникальное исследование атмосферы редкой экзопланеты масштаба Сатурна. Удачное сочетание факторов позволило космической обсерватории «Джеймс Уэбб» впервые детально изучить атмосферу экзопланеты, чей климат не так уж принципиально отличается от земного. Обычно такие планеты или слишком горячие, или ледяные, тогда как ...
    Читать дальше
  • Китай запустит на Луну «кентавров» — человекоподобных роботов на колёсных шасси

    На днях стало известно, что две следующие миссии по отправке Китаем луноходов на естественный спутник Земли будут весьма необычными. Для них создаются особенные роверы — с «человеческим» торсом на колёсных шасси. Это позволит автономным аппаратам совершать сложные действия на поверхности Луны с использованием пары «рук», что поможет в раз...
    Читать дальше
  • Blackview ROCK 5 — защищённый флагман с фонарём 348 люмен, Hi-Fi динамиком 5 Вт и защитой IP68/IP69K

    Для профессионалов, работников на открытом воздухе и любителей техники суровые условия часто создают проблемы: плохое освещение, шум, беспокойство о заряде батареи и надёжности устройства. В таких ситуациях пользователям нужно нечто большее, чем просто прочность — им требуется многофункциональное защищённое устройство, которое объединяет ...
    Читать дальше
  • Китайские учёные впервые воспроизвели механизм гибели нашей Вселенной в сценарии ложного вакуума

    Если наша Вселенная родилась и существует в условиях ложного вакуума, то её и нас с вами ждёт мгновенная гибель в любой момент времени. До недавнего времени это была только гипотеза. Однако учёные из Китая впервые воспроизвели в лабораторном эксперименте квантово-механические явления перехода ложного вакуума в истинный, доказав, что опыт ...
    Читать дальше

Заставить ИИ выдавать запрещённую информацию довольно просто, показали исследователи

Вчера, 08:42 | Просмотров: 345 | Новости IT

Этика использования систем искусственного интеллекта является животрепещущей проблемой, которой озабочены не только разработчики, но и государственные структуры. Официальные версии ИИ-моделей настроены так, чтобы не давать ответов на запросы, нацеленные на получение запретной информации. Тем не менее, модификация этих моделей позволяет довольно просто снять все подобные ограничения.

Как сообщает издание Financial Times, по его просьбе исследователи группы Alice, которые специализируются на безопасности в сфере ИИ, провели ряд экспериментов, доказав возможность обхода большинства этических ограничений на современных ИИ-моделях популярных разработчиков. По крайней мере, модифицированную версию модели с открытым исходным кодом Google Gemma 3 авторы эксперимента заставили ответить на запрос о методике распыления хлора в наполненном людьми помещении, сгенерировать программный код для хищения данных кредитных карт, а также написать рассказы, сюжет которых подразумевал растление несовершеннолетних.

Подобные модификации исходных ИИ-моделей, по данным исследователей группы Alice, получают определённое распространение, нивелируя усилия законодателей и регуляторов по предотвращению злонамеренного и преступного использования ИИ. Программные средства для модификации кода ПО распространяются независимо от создателей исходных ИИ-моделей. Инструменты для децензурирования ИИ-моделей распространяются свободно и бесплатно, отмечают авторы исследования.

К счастью, такие модификации сложно применить к ИИ-моделям с закрытым исходным кодом, но версии с открытым кодом обычно отстают от проприетарных аналогов в своём развитии на шесть или двенадцать месяцев, и их возможностей вполне хватает злоумышленникам для достижения своих целей. Доступ к версиям моделей со снятыми этическими ограничениями могут получить и лица, не обладающие серьёзными техническими познаниями. Представителям Financial Times удалось снять такие ограничения самостоятельно с модели Meta✴ Llama 3.3, воспользовавшись программным средством Heretic. Для этого было достаточно добавить четыре строчки кода и в общей сложности потратить около 10 минут, после чего модифицированная модель начала свободно обсуждать нюансы применения ядов для покушения на убийство.

Создатель Heretic признался, что с помощью этого программного средства уже удалось модифицировать более 3500 моделей, а количество скачиваний модифицированных моделей достигло 13 млн с прошлого года. С модели Google Gemma 4 сам создатель Heretic убрал ограничения в течение 90 минут после её выхода. По словам экспертов, исключение «вредного материала» при обучении ИИ-моделей не решает проблемы, поскольку они становятся «слишком наивными», и не могут достоверно определить случаи собственного злонамеренного использования. Представители GitHub объяснили наличие такого ПО на страницах ресурса тем, что оно может быть полезным для образовательных целей и приносит пользу всему сообществу специалистов по безопасности.

Написать комментарий

  • bowtiesmilelaughingblushsmileyrelaxedsmirk
    heart_eyeskissing_heartkissing_closed_eyesflushedrelievedsatisfiedgrin
    winkstuck_out_tongue_winking_eyestuck_out_tongue_closed_eyesgrinningkissingstuck_out_tonguesleeping
    worriedfrowninganguishedopen_mouthgrimacingconfusedhushed
    expressionlessunamusedsweat_smilesweatdisappointed_relievedwearypensive
    disappointedconfoundedfearfulcold_sweatperseverecrysob
    joyastonishedscreamtired_faceangryragetriumph
    sleepyyummasksunglassesdizzy_faceimpsmiling_imp
    neutral_faceno_mouthinnocent

Кликните на изображение чтобы обновить код, если он неразборчив

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.