Призраки во тьме

Как определять количество информации?

Очевидный парадокс возникает от того, что явно бросающийся в глаза рост объемов информации одновременно является и главным виновником ее… дефицита (!), поскольку отыскать нужную информацию в необъятном море самых различных ее источников становится все труднее, а сам процесс поиска может быть изначально обречен на погоню за призраком. С другой стороны, в дополнительный балласт превращается исключительно ценная для массового потребителя коротко живущая информация (реклама, новости, управленческие решения и т.п.) из-за превышения времени доступа над ее жизненным циклом. Определение фактических объемов информации как результата развития общества становится первым и необходимым шагом для решения возникающих проблем. Однако вывод, который можно сделать относительно имеющихся результатов исследований, может оказаться для многих полной неожиданностью - мы пока еще и понятия не имеем о том, сколько в действительности информации накоплено в обществе и какими темпами она растет. Как это ни покажется странным, но признание этого очевидного факта принесло бы неизмеримо больше пользы, чем все проведенные исследования в этом направлении вместе взятые.

Действительно, как можно измерять неизвестно что? Ведь полученные результаты исследований могут быть совершенно не сообразны существующим сейчас и изменяющимся прямо на глазах представлениям об информации. Тем не менее, различные оценки такого рода появились еще до наступления компьютерной эпохи. Так, например, в исследованиях проблемы внеземных цивилизаций еще в 70-х годах прошлого века фигурирует цифра 1018 байт информации в виде совокупного объема знаний, накопленных нашей цивилизацией за всю историю ее развития1 . Если бы это было действительно так! Однако даже более осторожные оценки объемов информации, сводящиеся фактически к объемам ее хранилищ, явно выходят за пределы какой-либо практической пригодности. Что может, например, прояснить факт того, что суммарный объем всех существующих хранилищ информации составляет примерно 2 эксабайта (2x1018 байт)?2 Ясно, что такой объем информации недоступен физически для прочтения, однако такая ситуация существует, как минимум, со времен римских императоров, когда объем рукописей, скажем, Александрийской библиотеки не мог быть прочитан одним человеком. Но как раз это никому и не нужно. Другое дело, если определить, насколько величина общего объема затрудняет доступ к нужной информации?

При такой постановке вопроса сразу выясняется, что скорость доступа в основном зависит не от объема информации, а от ее упорядоченности. Если предположить, что необходимая упорядоченность информации, даже в очень больших объемах (измеряемых, скажем, десятками эксабайт) обеспечивается, то для каждого конкретного запроса (на поиск данных) время его выполнения, по компьютерным меркам, не превысит нескольких миллисекунд, т.е. он может выполняться практически мгновенно (разумеется, скорость передачи данных здесь не в счет).

Механизм такого доступа известен уже давно. Например, при бинарном поиске при первом шаге отбрасывается половина всего объема пространства поиска, а на последующем - половина от оставшейся половины и т.д. Ясно, что объем даже в один эксабайт исчерпывается за пару десятков шагов, а компьютер за 1 секунду может выполнять миллионы таких шагов. Тем не менее, бинарный поиск - это еще не самый быстрый способ доступа к данным, т.к. иерархия поиска в этом случае содержит лишь две позиции данных на каждом уровне, а если их будет больше, то и скорость доступа, соответственно, возрастет.

Следовательно, реальный прогресс, с точки зрения обеспечения доступа потребителей к необходимой для них информации, может быть достигнут в направлении разработки источников информации универсального типа, что позволит обеспечить требуемую упорядоченность данных, время доступа к которым практически не будет зависеть от их общего объема. Если принять за основу структуру источника как совокупность единообразных иерархических позиций ("КВ" №6), то ее практическая реализация позволила бы придать вполне отчетливые очертания огромному числу призраков, относимых сейчас к реально существующей информации, и тем самым благополучно от них избавиться. С другой стороны, становятся возможными не только количественные, но и качественные характеристики информации. Вот как это примерно может выглядеть.

Если суть информации сводится к разнообразию ("КВ" №№43-44, 2000 г.), то суть ее количества, очевидно, не может относиться к характеристикам носителей (в виде емкости любого разнообразия вообще), а должно определяться структурными элементами источника информации. Очевидно, что такими элементами являются иерархические позиции (ничего другого там просто нет), следовательно, количество информации - это характеристика единообразной структуры источника информации, определяемая числом позиций данных.

Как видно из этого определения, оно принципиально отличается от традиционных представлений о количестве информации, берущих свое начало еще от Клода Шеннона. Согласно данному определению, если, скажем, полный текст Библии размещается в источнике информации как приложение к одной позиции данных в виде последовательной записи (например, текстового файла), то количество информации в этой конкретной позиции также будет равно единице. Кажущаяся явная "нелепость" такого вывода быстро уступит место очевидной целесообразности, если этот случай сравнить с другим, т.е. когда текст той же самой Библии размещается на десятках тысяч позиций источника ("КВ" №8). Ясно, что во втором случае все содержание книги будет у потребителя как на ладони (особенно, если вместе со ссылками будут сформированы алфавитный и предметный указатели), в то время как в первом случае, чтобы только ознакомиться с ней, ему придется пролистать весь текст от начала до конца.

Для более полной характеристики источника информации, кроме количества позиций данных, можно еще определять его структурированность - произведение количества уровней иерархии на общее количество реквизитов всех уровней, а также количество приложений к позициям данных, распределенное по основным типам (изображения, видео, звук и т.п.). При достижении такого уровня развития компьютерных источников информации для призраков, вольготно поедающих сейчас обширные стратегические ресурсы общества, просто не останется места.

Юрий КРАСКОВ,
c_city2000@mail.ru

Все права на публикацию принадлежат автору

1 Шкловский И.С. Вселенная, жизнь, разум – п. 23. М., Наука, 1987.

2 Игорь Гордиенко. Шаг в призрачный макрокосмос - Компьютерра №37, 2000 г.

Версия для печатиВерсия для печати

Номер: 

14 за 2001 год

Рубрика: 

Новые технологии
Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!

Комментарии

Аватар пользователя М. Дак
Упорство, с которым автор толчет воду в ступе, вызывает восхищение, а его глубокомысленный вид - уважение.
Аватар пользователя Пцыца
За год упорного толчения уже могли бы измениться физические, химические и даже психические свойства ступы и даже воды, но... мы всё ждем обещанной Революции в Науке об Информации... а получаем сотни килобайт (ща мы дадим дефиницию килобайту:)) неинформативного текста... что считаю лучшей шуткой КВ за 6 лет!