• Илон Маск раскрыл первые подробности об ИИ-спутнике AI1

    В ходе нового интервью Илон Маск рассказал о спутнике AI1 для выполнения ИИ-вычислений прямо на орбите. Глава SpaceX также затронул темы ракет Starship, фабрики по производству чипов и будущей инфраструктуры для искусственного интеллекта.
    Читать дальше
  • Экраноплан WaveFly 5X может парить прямо над водой (видео)

    Китайская компания NAVEE представила необычное транспортное средство под названием WaveFly 5X. Новинка способна скользить над поверхностью воды, создавая ощущение низкого полёта.
    Читать дальше
  • В устройствах Apple с чипами A12 и A13 найдена неустранимая уязвимость, подходящая для джейлбрейка

    Исследователи безопасности из Paradigm Shift опубликовали технические детали новой, неустранимой, по их утверждению, уязвимости BootROM, получившей название usbliter8. Данный эксплойт базируется на недостатках оборудования и позволяет выполнять произвольный код на устройствах компании Apple, оснащённых процессорами поколений A12 и A13.
    Читать дальше
  • Telegram через суд обжаловал блокировку в Индии

    Администрация мессенджера Telegram подала в суд в Нью-Дели иск, в котором оспорила распоряжение властей страны о временной блокировке платформы в целях предотвращения мошенничества на экзаменах.
    Читать дальше
  • Commodore анонсировала кнопочный смартфон-раскладушку за $499 (3 фото)

    Когда новым руководителем остатков легендарной Commodore стал энтузиаст ретротехники Кристиан Симпсон (Christian Simpson), было принято решение, что компания начнёт двигаться вперёд с того места, на котором остановилась оригинальная Commodore. В результате на рынке появились портативные консоли, вдохновлённые легендарной Commodore 64. Теп...
    Читать дальше

Alibaba представила открытую ИИ-модель, которая лучше OpenAI

28 ноября 2024 | Просмотров: 7 315 | Новости IT
Alibaba представила открытую ИИ-модель, которая лучше OpenAI

Китайская компания Alibaba представила модель искусственного интеллекта с открытым исходным кодом под названием QwQ-32B-Preview. Модель способна решать сложные логические и математические задачи, содержит 32,5 миллиарда параметров и может обрабатывать запросы длиной до 32 000 слов. По тестам, проведённым Alibaba, QwQ-32B-Preview превосходит модели o1-preview и o1-mini от OpenAI в ряде показателей.

Одним из ключевых преимуществ QwQ-32B-Preview, как сообщает TechCrunch, является её производительность в тестах AIME и MATH. Тест AIME оценивает работу модели с помощью других искусственных интеллектов, а MATH представляет собой набор текстовых математических задач. Благодаря своим особенностям, этот ИИ-бот способен решать сложные задачи и логические головоломки. Однако отмечается, что QwQ-32B-Preview не лишена недостатков: она может неожиданно менять язык общения, зацикливаться на некоторых моментах и хуже справляется с заданиями, когда требуется задействовать здравый смысл.

Интересной особенностью QwQ-32B-Preview является способность «проверять саму себя». Это помогает избегать ошибок-ловушек, свойственных другим системам искусственного интеллекта, однако замедляет процесс нахождения решений. Как и модели o1 от OpenAI, новая разработка Alibaba решает задачи поэтапно, постепенно анализируя и планируя дальнейшие шаги.

Несмотря на то, что QwQ-32B-Preview доступна для скачивания на платформе Hugging Face под лицензией Apache 2.0 (свободное программное обеспечение), что позволяет использовать её в коммерческих целях, Alibaba раскрыла лишь часть компонентов модели, тем самым не позволяя изучить внутренние механизмы работы алгоритма. Таким образом, несмотря на заявления об «открытости», модель остаётся промежуточным вариантом между закрытыми и открытыми системами (open source license).

Китайское происхождение модели также накладывает определённые ограничения. Как и другие разработки из Китая, QwQ-32B-Preview следует требованиям местного регулятора, который проверяет ИИ на соответствие «основным социалистическим ценностям». На вопросы политического характера, связанных с Китаем, модель отвечать откажется.

Стоит сказать, что интерес к «рассуждающим» моделям растёт на фоне снижения эффективности традиционного подхода к увеличению возможностей ИИ, основанного на простом масштабировании данных и вычислительных мощностей. Компании, такие как OpenAI, Google и Anthropic, всё чаще сталкиваются с замедлением прогресса своих технологий, что в свою очередь, стимулирует разработчиков искать новые подходы, например, такие как «вычисления на этапе выполнения» (test-time compute), которые дают моделям дополнительное время для обработки задач. При этом крупные лаборатории, включая Google, активно инвестируют в развитие подобных технологий, что подтверждает их ключевую роль в будущем искусственного интеллекта.

Комментарии: 0

В Вашем браузере отключен JavaScript. Для корректной работы сайта настоятельно рекомендуется его включить.