
Команда "Сбербанка" сообщила о скором выпуске новой версии фирменной нейросети для генерации видео — Kandinsky 4.1 Video. Первыми доступ к Kandinsky 4.1 Video получили участники технологической конференции GigaConf, а также некоторые художники и дизайнеры. Об этом заявил старший вице-президент, руководитель блока "Технологическое развитие" "Сбербанка" Андрей Белевцев в рамках GigaConf.
В основе новой модели лежит архитектура диффузионного трансформера. Как отметили в Сбере, одним из факторов, позволивших улучшить качество модели, стало её дообучение (Supervised Fine-Tuning, SFT) на данных, подготовленных более чем 100 экспертами — дизайнерами, фотографами и художниками с профильным образованием.
Нейросеть Kandinsky Video, разработанная "Сбербанком", является генеративной моделью для создания видеороликов по текстовому описанию или изображению. Это первая в России технология подобного рода, ориентированная на генерацию реалистичного видео с движением объектов и фона. В ноябре 2023 года дебютировала первая версия модели, способная генерировать видео продолжительностью до 8 секунд (512 х 512 пикселей, 30 кадров/с).





