• В России создали первый в мире квантовый компьютер на кусептах — это решит проблему масштабирования

    «Долго запрягают, но быстро ездят» — эта, то ли цитата, то ли пословица хорошо ложится на разработку квантовых платформ в России. Эти платформы плохо масштабируются, что вынуждает думать об основе, прежде чем начинать создавать практичные решения. И тогда перспективы открываются у многоуровневых кубитов — кудитов. Лучшие разработки в э...
    Читать дальше
  • Хакер, приговорённый к пяти годам тюрьмы за кражу 120 тыс. биткоинов, досрочно вышел на свободу благодаря Трампу

    Хакер Илья Лихтенштейн с российским и американским гражданством, приговорённый к пяти годам тюремного заключения за кражу 119,7 тыс. биткоинов с гонконгской криптобиржи Bitfinex в 2016 году, досрочно вышел на свободу. Отсидев лишь 14 месяцев, он был освобождён благодаря закону First Step Act, подписанному Дональдом Трампом во время его...
    Читать дальше
  • Интерпол арестовал хакера, который заразил миллионы компьютеров через поддельную утилиту KMSAuto

    В Грузии арестован 29-летний гражданин Литвы — он подозревается в заражении 2,8 млн компьютеров вредоносным ПО, которое манипулирует содержимым буфера обмена, маскируясь под утилиту KMSAuto для нелицензионной активации Microsoft Office и Windows.
    Читать дальше
  • Fitasy показала кроссовки с идеальной посадкой, созданные с помощью смартфона и 3D-печати

    Компания Fitasy представила кроссовки Stride, созданные с использованием технологии 3D-печати. Кроссовки обладают идеальной посадкой, поскольку создаются по индивидуальным замерам стопы, полученным с помощью смартфона и пространственного ИИ-моделирования.
    Читать дальше
  • Найден новый способ «уплотнения» чипов без смены техпроцесса

    Команда исследователей Samsung Electronics совместно с американскими технологическими университетами нашла альтернативный способ увеличения плотности транзисторов на одном кристалле. Учёные разработали метод, позволяющий размещать дополнительный слой микросхем на уже готовом чипе.
    Читать дальше

Alibaba нашла способ сократить потребность в количестве используемых ускорителей Nvidia на 82 %

20 октября 2025 | Просмотров: 1 968 | Гаджет новости

Нехватка вычислительных мощностей, присущая динамично развивающемуся рынку искусственного интеллекта, в Китае усугубляется ограничениями на импорт специализированных ускорителей. Разработчики вынуждены заниматься оптимизацией, и Alibaba нашла способ сократить количество необходимых ускорителей Nvidia для работы своих языковых моделей на 82 %.

Как поясняет South China Morning Post, бета-тестирование профильной системы Aegaeon уже проводится одним их подразделений Alibaba Cloud на протяжении более чем трёх месяцев. По информации, представленной Alibaba на мероприятии SOSP в столице Южной Кореи, данная система позволила сократить количество обслуживающих десятки языковых моделей ускорителей Nvidia H20 с 1192 до 213 штук. При этом соответствующие языковые модели используют до 72 млн параметров, как поясняет источник.

Представителям Alibaba в создании такой системы помогали учёные Пекинского университета, которые назвали её «первой попыткой выявить излишние затраты, связанные с одновременным обслуживанием нагрузок с большими языковыми моделями». Провайдеры облачных услуг типа Alibaba сталкиваются с необходимостью одновременного обслуживания тысяч ИИ-моделей, но в сфере инференса наиболее часто используются лишь несколько моделей типа Qwen или DeepSeek, а прочие вызываются довольно редко. Это приводит к нерациональному расходованию ресурсов. В экосистеме Alibaba Cloud, например, до 17,7 % ускорителей выделяются для обработки 1,35 % запросов.

Исследователи во всём мире начали предлагать повысить эффективность использования вычислительных ресурсов за счёт объединения в пулы, когда один GPU обслуживает несколько моделей. Система Aegaeon использует автомасштабирование на уровне токенов, позволяющее GPU переключаться между разными моделями прямо в процессе генерирования токенов. Один GPU в результате способен обрабатывать до семи моделей, тогда как в альтернативно устроенных системах их количество в лучшем случае достигает двух или трёх. Задержки, необходимые на переключение между моделями, при этом сократились на 97 % в случае с Aegaeon.

Alibaba эту систему испытывает на маркетплейсе моделей Bailian, который предлагает модели Qwen корпоративным пользователям. Ускорители Nvidia H20 одноимённой американской компанией были созданы специально для китайского рынка, в апреле они попали под временный запрет на поставку в КНР, но к лету он был снят. Однако, китайские власти начали настоятельно рекомендовать национальным разработчикам отдавать предпочтение местной компонентной базе. В результате позиции Nvidia на китайском рынке передовых чипов для ИИ, по словам руководителя компании, буквально сократились до нуля.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.