• Космические дата-центры SpaceX будут охлаждаться жидким аммиаком — и это усложнит их утилизацию

    Глава и основатель SpaceX Илон Маск поделился подробностями об устройстве своих космических ЦОД, которыми он буквально намерен заполнить околоземное пространство в ближайшие годы. Каждый такой космический аппарат размером с авиалайнер будет использовать систему жидкостного охлаждения, однако её наполнение не позволит утилизировать такие с...
    Читать дальше
  • Nintendo оштрафовали на 35 миллионов евро за дрифт стиков Joy-Con

    Одной из главных проблем консоли Nintendo Switch были дрифтующие стики — элементы управления массового выходили из строя. Теперь компании придётся выплатить 35 миллионов евро штрафа.
    Читать дальше
  • Роскомнадзор и Минцифры увидели основания для разблокировки Roblox в России

    Газета «Коммерсантъ» со ссылкой на пресс-службу Министерства цифрового развития, связи и массовых коммуникаций РФ (Минцифры) сообщила о скорой разблокировке в России игровой платформы Roblox от Roblox Corporation.
    Читать дальше
  • Все смартфоны в России поставят на учёт по IMEI

    Госдума во втором и третьем чтениях приняла «Антифрод 2.0» — пакет поправок к законам, направленный на борьбу с кибермошенниками. Он включает комплекс мер, которые, по задумке законодателей, помогут в противодействии преступной деятельности в интернете, пишут «Ведомости» со ссылкой на заявление главы комитета Госдумы по информационной пол...
    Читать дальше
  • Вышла полноценная версия Telegram для Apple Watch

    Спустя более чем десять лет после выхода первого варианта приложения Telegram для Apple Watch и последующего прекращения его поддержки мессенджер выпустил обновлённый вариант нативного клиента для умных часов.
    Читать дальше

Alibaba представила открытую ИИ-модель, которая лучше OpenAI

28 ноября 2024 | Просмотров: 7 295 | Новости IT
Alibaba представила открытую ИИ-модель, которая лучше OpenAI

Китайская компания Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Модель способна решать сложные логические и математические задачи, содержит 32,5 миллиарда параметров и может обрабатывать запросы длиной до 32 000 слов. По тестам, проведённым Alibaba, QwQ-32B-Preview превосходит модели o1-preview и o1-mini от OpenAI в ряде показателей.

Одним из ключевых преимуществ QwQ-32B-Preview, как сообщает TechCrunch, является её производительность в тестах AIME и MATH. Тест AIME оценивает работу модели с помощью других искусственных интеллектов, а MATH представляет собой набор текстовых математических задач. Благодаря своим особенностям, этот ИИ-бот способен решать сложные задачи и логические головоломки. Однако отмечается, что QwQ-32B-Preview не лишена недостатков: она может неожиданно менять язык общения, зацикливаться на некоторых моментах и хуже справляется с заданиями, когда требуется задействовать здравый смысл.

Интересной особенностью QwQ-32B-Preview является способность «проверять саму себя». Это помогает избегать ошибок-ловушек, свойственных другим системам искусственного интеллекта, однако замедляет процесс нахождения решений. Как и модели o1 от OpenAI, новая разработка Alibaba решает задачи поэтапно, постепенно анализируя и планируя дальнейшие шаги.

Несмотря на то, что QwQ-32B-Preview доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0 (свободное программное обеспечение), что позволяет использовать её в коммерческих целях, Alibaba раскрыла лишь часть компонентов модели, тем самым не позволяя изучить внутренние механизмы работы алгоритма. Таким образом, несмотря на заявления об «открытости», модель остаётся промежуточным вариантом между закрытыми и открытыми системами (open source license).

Китайское происхождение модели также накладывает определённые ограничения. Как и другие разработки из Китая, QwQ-32B-Preview следует требованиям местного регулятора, который проверяет ИИ на соответствие «основным социалистическим ценностям». На вопросы политического характера, связанных с Китаем, модель отвечать откажется.

Стоит сказать, что интерес к «рассуждающим» моделям растёт на фоне снижения эффективности традиционного подхода к увеличению возможностей ИИ, основанного на простом масштабировании данных и вычислительных мощностей. Компании, такие как OpenAI, Google и Anthropic, всё чаще сталкиваются с замедлением прогресса своих технологий, что в свою очередь, стимулирует разработчиков искать новые подходы, например, такие как «вычисления на этапе выполнения» (test-time compute), которые дают моделям дополнительное время для обработки задач. При этом крупные лаборатории, включая Google, активно инвестируют в развитие подобных технологий, что подтверждает их ключевую роль в будущем искусственного интеллекта.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.