
Microsoft представила две собственные модели искусственного интеллекта: MAI-Voice-1 для генерации речи и MAI-1-preview в качестве фундаментальной модели. MAI-Voice-1 уже используется в приложениях Copilot Daily и Podcasts для создания аудиосводок новостей и прогноза погоды.
Оценить возможности этой голосовой модели можно через новый интерфейс Copilot Labs, где пользователи могут вставить текст, выбрать голос, стиль и режим для создания высококачественного аудио. Сгенерированный аудиофайл можно скачать. Microsoft отмечает высокую скорость и эффективность MAI-Voice-1: генерация минуты аудио занимает менее секунды при использовании одного GPU. MAI-1-preview, представленная в виде публичной бета-версии на платформе LMArena, предназначена для оценки сообществом. Это первая фундаментальная модель MAI, разработанная Microsoft самостоятельно после комплексного обучения, и она демонстрирует будущие возможности Copilot.
MAI-1-preview представляет собой MoE-модель (смешанную модель экспертов), обученную на примерно 15 000 специализированных ускорителях Nvidia H100. Компания заявляет, что модель эффективно выполняет инструкции и предоставляет полезные ответы на повседневные вопросы пользователей. В ближайшие недели Microsoft планирует использовать MAI-1-preview для некоторых текстовых функций Copilot. Microsoft подчеркивает, что MAI-1-preview не заменит модели OpenAI в Copilot. Компания планирует использовать лучшие решения как собственной команды, так и партнеров, включая сообщество разработчиков открытого исходного кода. MAI-1-preview также доступна через API для доверенных тестировщиков.





