"Дополненная реальность" или как видеть невидимое

Проблема человеко-компьютерного интерфейса в настоящее время приобретает все большую актуальность и остроту. Существующий ныне способ взаимодействия компьютера и человека явно неудовлетворительный, и не только с точки зрения его неэргономичности. Может быть, более важная причина состоит в том, что существующий - прежде всего мониторный - интерфейс раскалывает мир человека на две реальности: одна - та, что естественным образом окружает человека, та, в которой он живет и действует; другая - та, что по ту сторону компьютерного дисплея. Компьютер - это информационный процессор, и его первейшее предназначение - обеспечивать человека информацией, необходимой для успешной деятельности в первой реальности, которую философы называют действительностью. Однако существующий интерфейс заставляет человека попеременно быть то в одной, то в другой реальности, что часто ведет к психологическим перегрузкам и сводит на нет те выгоды, которые дает использование современных мощных компьютеров.

Ведущая тенденция современных исследований данной проблемы - устранить этот раскол между миром смыслов, целей и действий и миром информации и моделей. Один путь - вообще отказаться от использования компьютеров и полагаться на собственные интеллектуальные ресурсы. Способ надежный, но едва ли реализуемый в обозримом будущем. Второй путь - стать человеко-машиной, киборгом и таким образом совместить обе реальности. Третий путь - отказаться от действительности в пользу так называемой виртуальной реальности (VR). И четвертый путь - совместить обе реальности, не переставая при этом оставаться просто хорошо технически вооруженным человеком. Вот об этом четвертом пути и пойдет дальше речь.

Теоретики "дополненной реальности" (augmented reality или AR; от англ. augment - "увеличивать, прибавлять"), как и теоретики "виртуальной реальности", возводят свои концепции к пионерским работам 60-х годов прошлого столетия по компьютерной графике Ивана Сьютерленда (Ivan Sutherland) и его студентов в университетах Гарварда и Юты. Собственно, термин "augmented reality" был изобретен в начале 90-х годов учеными корпорации Boeing, которые разрабатывали AR-систему, способную помочь рабочим соединять жгуты проводов. Позднее значительное снижение цен на производительную компьютерную технику сделало возможными масштабные лабораторные исследования по AR-проблематике. Но только в 1998 году ученые собрались на первую специализированную конференцию, которая с тех пор проводится ежегодно.

Стивен К. Фейнер (Steven K. Feiner), профессор Колумбийского университета, директор лаборатории компьютерной графики и пользовательских интерфейсов, один из ведущих специалистов нового направления, так характеризует "дополненную реальность": "Дополненная реальность (AR) имеет дело с компьютерными дисплеями, которые добавляют виртуальную информацию к чувственным восприятиям пользователя. AR-системы используют те же самые аппаратные технологии, что и в исследованиях по виртуальной реальности, однако имеется и принципиальное отличие: в то время как виртуальная реальность дерзко нацелена на замещение реального мира, дополненная реальность почтительно дополняет его".

Виртуальная информация может быть в любой форме в соответствии со спецификой человеческих органов чувств (визуальной, слуховой, осязательной, вкусовой и обонятельной). Но информационная емкость визуальной информации не сравнима ни с какой другой. Поэтому именно ее сочетанию с видом реального окружающего мира посвящено наибольшее количество исследований.

В настоящее время одно из важнейших направлений в разработке AR-систем - создание так называемых "прозрачных дисплеев" (see-through display), которые позволяют полноценно видеть все объекты окружающего мира, но также и то, что увидеть в буквальном смысле никак нельзя - информацию об этих объектах. Кроме дисплеев, в таких системах обязательными компонентами являются треккеры, или системы слежения, и графический компьютер с соответствующим программным обеспечением. Система слежения определяет направление взгляда, и графическая система проецирует на прозрачный дисплей дополнительную информацию (графическую и/или текстовую), совмещая ее с образом воспринимаемого объекта.

Стивен К. Фейнер приводит некоторые примеры ситуаций, в которых такое дополнение реальности будет весьма полезным. Например, взгляд упал на подлежащий починке узел какого-либо устройства, и AR-система проецирует инструкцию по ремонту данного узла. Или хирург сможет видеть не только реальное тело больного, но и спроецированные на него в реальном масштабе рентгеновские или ультразвуковые изображения внутренних органов. Турист сможет видеть обзор всех ресторанов той улицы, по которой он идет, и т.д. Расширить данный перечень сможет без труда каждый. Главное, как замечает Фейнер, это "получение адекватной информации в нужное время и в нужном месте".

В настоящее время разрабатываются два типа прозрачных дисплеев: оптические и видео. Первые основаны на использовании полупрозрачных зеркал. При соответствующей ориентации относительно глаза компьютерный образ будет отражаться по направлению взгляда и как бы накладываться на образ реального объекта. Для фокусировки используется система линз. Будучи раздельными для каждого глаза, оптические дисплеи будут создавать стереоскопическое изображение.

Принцип действия видеодисплеев совсем другой. В них полученное видеокамерой изображение объекта совмещается с синтезированным компьютерным. Технология напоминает ту, что используется на телевидении для создания спецэффектов. В основном, видеодисплеи создаются на основе жидкокристаллических матриц, но недавно фирма Microvision стала использовать лазер малой мощности для проекции изображений прямо на сетчатку.

Для корректной работы дисплеев обоих типов огромное значение имеет точность, с которой определяются пространственные параметры как объектов, так и головы пользователя. Для обеспечения надлежащей точности используют целый набор разнообразных устройств: от оптических, видео и ультразвуковых локаторов до гироскопов, акселерометров, магнитометров (для позиционирования относительно магнитного поля Земли) и даже GPS-ресиверов.

Однако, какими бы быстродействующими ни были применяемое аппаратное и программное обеспечение, между движениями пользователя и откликом системы всегда существует задержка, что создает ощущение нереальности "дополненной реальности". Один из способов избежать этой неприятности - использовать "интеллектуальные" системы, которые могли предсказывать возможные последующие движения, исходя из анализа предыдущих.

У AR-технологии много серьезных, прежде всего аппаратных, проблем. Для примера действующий прототип мобильной AR-системы (MARS), разработанный Фейнером и коллегами, весит 11 кг и включает в себя: ноутбук с 3D графической картой и беспроводной сетевой картой стандарта IEEE 802.11b; треккер с кинематическим GPS-ресивером и ресивером GPS-коррекций; блок питания (батареи и регулятор напряжения); носимый на голове дисплей; устройства взаимодейства и GPS-антенну. И все это уже реальность.

А как всякий энтузиаст своего дела, Стивен К. Фейнер уверен, что уже в недалеком будущем (возможно, лет через 10) AR-системы станут более массовыми, чем теперь телефоны или персональные компьютеры. Надо только сделать так, чтобы размеры аппаратуры не превышали размеры сегодняшних МР3-плееров…

Ну что же, дело за малым.

При написании статьи использован материал, который будет опубликован в апрельском номере журнала "Scientific American".

Для более подробного знакомства с AR-технологиями см. библиографию на www.cs.columbia.edu/graphics/publications/publications.html.

Сергей САНЬКО