• Blackview представила MEGA 5 — 12,2-дюймовый AI-планшет для продуктивной работы с комплектной клавиатурой, мышью и стилусом

    Многим пользователям смартфонов не хватает по-настоящему захватывающего большого экрана, а ноутбуки часто кажутся слишком тяжёлыми для лёгкой работы на ходу. Продолжая расширять линейку умных планшетов и многофункциональных устройств, компания Blackview представляет MEGA 5 — 12,2-дюймовый AI-планшет, который идеально сочетает в себе развл...
    Читать дальше
  • Роскомнадзор усилил блокировку Telegram, взявшись за MTProto-прокси

    С конца прошлой недели в России началась новая волна блокировок мессенджера Telegram. Формально сервис на территории страны не заблокирован, а замедлен. Тем не менее, на этот раз были брошены силы на блокировку используемых платформой прокси-серверов.
    Читать дальше
  • Acer представила первый ноутбук на Snapdragon C с ценой от 300$

    Очевидно, доступность и качество дизайна MacBook Neo от Apple задели производителей устройств на Windows. Qualcomm решила вступить в игру на бюджетном поле, представив платформу Snapdragon C. Первым устройством на её базе стал Acer Aspire Go 15. Согласно пресс-релизу Acer, ноутбук Aspire Go 15 появится в продаже по неопределённой «начальн...
    Читать дальше
  • Apple выпустила первую публичную бета-версию iOS 26.6

    Ранее на этой неделе Apple выпустила первую бета-версию iOS 26.6 для разработчиков. Теперь же стала доступна первая публичная бета-версия мобильной программной платформы производителя iPhone.
    Читать дальше
  • YouTube начал ограничивать доступ к видео и трансляциям для пользователей с VPN

    YouTube начал ограничивать доступ к некоторому контенту пользователям с VPN. Ограниченные материалы могут не показываться вообще или запускаться, но с просьбой отключить дополнительные средства доступа. Мера может быть связана с региональными лицензионными ограничениями на контент. Проблема непосредственно коснулась россиян.
    Читать дальше

Alibaba нашла способ сократить потребность в количестве используемых ускорителей Nvidia на 82 %

20 октября 2025 | Просмотров: 2 323 | Гаджет новости

Нехватка вычислительных мощностей, присущая динамично развивающемуся рынку искусственного интеллекта, в Китае усугубляется ограничениями на импорт специализированных ускорителей. Разработчики вынуждены заниматься оптимизацией, и Alibaba нашла способ сократить количество необходимых ускорителей Nvidia для работы своих языковых моделей на 82 %.

Как поясняет South China Morning Post, бета-тестирование профильной системы Aegaeon уже проводится одним их подразделений Alibaba Cloud на протяжении более чем трёх месяцев. По информации, представленной Alibaba на мероприятии SOSP в столице Южной Кореи, данная система позволила сократить количество обслуживающих десятки языковых моделей ускорителей Nvidia H20 с 1192 до 213 штук. При этом соответствующие языковые модели используют до 72 млн параметров, как поясняет источник.

Представителям Alibaba в создании такой системы помогали учёные Пекинского университета, которые назвали её «первой попыткой выявить излишние затраты, связанные с одновременным обслуживанием нагрузок с большими языковыми моделями». Провайдеры облачных услуг типа Alibaba сталкиваются с необходимостью одновременного обслуживания тысяч ИИ-моделей, но в сфере инференса наиболее часто используются лишь несколько моделей типа Qwen или DeepSeek, а прочие вызываются довольно редко. Это приводит к нерациональному расходованию ресурсов. В экосистеме Alibaba Cloud, например, до 17,7 % ускорителей выделяются для обработки 1,35 % запросов.

Исследователи во всём мире начали предлагать повысить эффективность использования вычислительных ресурсов за счёт объединения в пулы, когда один GPU обслуживает несколько моделей. Система Aegaeon использует автомасштабирование на уровне токенов, позволяющее GPU переключаться между разными моделями прямо в процессе генерирования токенов. Один GPU в результате способен обрабатывать до семи моделей, тогда как в альтернативно устроенных системах их количество в лучшем случае достигает двух или трёх. Задержки, необходимые на переключение между моделями, при этом сократились на 97 % в случае с Aegaeon.

Alibaba эту систему испытывает на маркетплейсе моделей Bailian, который предлагает модели Qwen корпоративным пользователям. Ускорители Nvidia H20 одноимённой американской компанией были созданы специально для китайского рынка, в апреле они попали под временный запрет на поставку в КНР, но к лету он был снят. Однако, китайские власти начали настоятельно рекомендовать национальным разработчикам отдавать предпочтение местной компонентной базе. В результате позиции Nvidia на китайском рынке передовых чипов для ИИ, по словам руководителя компании, буквально сократились до нуля.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.