Alibaba представила QwenLong-L1 — новую архитектуру больших языковых моделей (LLM), способную эффективно обрабатывать исключительно длинные входные данные. Это открывает широкие возможности для корпоративных приложений, работающих с масштабными документами: от подробных отчётов и финансовой отчётности до сложных юридических контрактов.
-
-
Представленный способ снижает расходы на обучение нейросетей для поиска почти на 90%.
12 мая, 2025 - 15:30 -
Несмотря на уменьшенный размер, эта версия сохраняет более 90% мультимодальной производительности и способна обеспечивать генерацию как текстового контента, так и естественной речи в онлайн-режиме.
5 мая, 2025 - 09:30 -
Qwen 3 — это одна из версий языковой модели Tongyi Qianwen, разработанной Alibaba Cloud. Ниже приведены основные отличия Qwen 3 от предыдущих версий, таких как Qwen 2 или Qwen 2.5, по функциональным возможностям.
30 апреля, 2025 - 15:30 -
Предварительные результаты тестов свидетельствуют о том, что эта модель превосходит более крупные конкурирующие решения, такие как Gemma 3-27B и Mistral Small 3.1 24B.
27 марта, 2025 - 17:30 -
Исследователи продемонстрировали, как их новая модель определяет эмоциональное состояние человека на видео, а также описывает его одежду и окружение.
13 марта, 2025 - 17:30 -
Эта модель демонстрирует улучшенные возможности рассуждения и, по заявлениям разработчиков, превосходит DeepSeek R1 по производительности при меньшем потреблении ресурсов.
7 марта, 2025 - 09:30 -
Alibaba выпустила четыре варианта Wan 2.1: T2V-1.3B, T2V-14B, I2V-14B-720P и I2V-14B-480P — эти модели генерируют видео и статические картинки по текстовому запросу или по образцу, которым может служить изображение.
26 февраля, 2025 - 15:30 -
Эта модель искусственного интеллекта построена на архитектуре Mixture-of-Experts (MoE) и была обучена на свыше 20 триллионов токенов. Разработчики отметили, что инструмент демонстрирует «значительные достижения в области интеллектуальных функций» и уже доступен для пользователей
29 января, 2025 - 11:30 -
Система Tongyi Lingma способна осуществлять полный спектр задач: от анализа запросов и написания кода до отладки и завершения создания приложения. Как утверждает компания, этот инструмент позволяет увеличить эффективность программирования более чем в 10 раз, что может значительно упростить процесс разработки.
11 января, 2025 - 13:30