Google научила ИИ повышать разрешение фото в 16 раз без потери качества

Google опубликовала в своём блоге исследование специалистов из внутренней команды Brain Team, озаглавленное как «Создание высокоточных изображений с использованием моделей диффузии». В статье исследователи рассказывают о новых достижениях, которые они сделали в области масштабирования цифровых изображений без потери качества.

Специалисты Google Brain Team натренировали модель машинного обучения превращать фотографии с низким разрешением в детализированные изображения с высоким разрешением практически без потери качества. Эксперты считают, что их разработка может использоваться в самых разных целях: от улучшения старых семейных фото до повышения качества медицинских изображений.

Концепция диффузионных моделей изучается Google с 2015 года, однако до недавнего времени поисковый гигант отдавал предпочтение другому семейству методов обучения ИИ — глубоким генеративным моделям. Компания обнаружила, что результаты нового подхода заметно превосходят существующие технологии.

Новый подход получил обозначение SR3. Google говорит, что SR3 — это модель диффузии со сверхвысоким разрешением, которая создаёт изображение с высоким разрешением из чистого шума, опираясь на исходную картинку с низким разрешением. Модель обучается процессу искажения изображения, при котором шум постепенно добавляется к изображению до тех пор, пока не останется только чистый шум. Затем алгоритм обращает процесс вспять, постепенно удаляя шум, с изображения, руководствуясь исходной картинкой с низким разрешением.

Было обнаружено, что наилучшие результаты SR3 демонстрирует при масштабировании портретов и снимков природы. Алгоритм позволяет добиться фотореалистичного изображения при повышении разрешения портретов до шестнадцати раз.

 

Как только Google убедилась, насколько эффективна SR3, компания пошла ещё дальше, предложив ещё один подход под названием CDM, который представляет собой модель условно-классовой диффузии. CDM обучена на данных ресурса ImageNet, содержащего более 14 миллионов изображений с высоким разрешением. CDM предлагает каскадный подход, при котором сначала генерируется изображение с низким разрешением, за которым следует работа SR3 по созданию изображений с высоким разрешением, которое постепенно повышается до максимально возможного. По данным Google, изображение с разрешением 32 × 32 пикселя может быть увеличено до 256 × 256 пикселей без ощутимых потерь, в восемь раз. Картинку с разрешением 64 × 64 пикселя и вовсе удалось масштабировать до разрешения 1024 × 1024 пикселя, в 16 раз.

 

Читайте новости первыми в нашем Telegram-канале!

Подписывайтесь на наш канал в Дзен!

Версия для печатиВерсия для печати

Регион: 

Рубрики: 

Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!

Читайте также

 

Комментарии

Очередной фальшак как мегапикселя в телефонах. Вроде и 47 мегапикселей, а развернешь на полный экран - мыло мылом. 

Аватар пользователя mike

Создаёт изображение с высоким разрешением из чистого шума...

А что? Именно так и рождаются галлюцинации.

:) 

Аватар пользователя Petro42

Это будет ужасное изображение. Можно представить себе, что будет с цветами и тенями. 

Аватар пользователя mike

Не, Петро. Речь шла об улучшении конкретных материалов - - фотопортретов и пейзажей.

Все мы видели заблюренные квадратиками лица, но если прищуриться, то сознание ретуширует блюр, и порой даже можно узнать человека. Это происходит потому что мозг (в данном случае - - ИИ) уже знает, как устроено лицо или морда, и как-то подставляет в ретину подходящие переходы между квадратиками с помощью более мелких квадратиков, затем блюрит (зашумливает) ретину и как-то сличает с оригиналом. И так, похоже, много раз для наиболее правдоподобного улучшения. Алгоритмов много, и все они умные.

Работают люди, получают зарплату. Гугл  может позволить себе их содержать, тем более, что при успехе результаты окупятся. 

Аватар пользователя Petro42

До успеха, как видно, далеко. 

Аватар пользователя mike

До успеха, как видно, далеко.

Ну почему же. Такие продукты должны пользоваться спросом. А спрос и есть успех.