Частота дискретизации или 24 кадра в секунду
Довольно много споров ходит по поводу того, что именно отображает теорема Котельникова (которая на Западе больше известна как Нейквиста). О чем она говорит? Объясню своими словами, как бы это понял обычный пользователь: предел качества звука, воспринимаемого человеческим ухом, может быть достигнут, если частота дискретизации превышает верхний предел слышимых частот в два раза. В зависимости от этого был сформирован стандарт звучания CD - 16 бит, 44,1 КГц. И по своим характеристикам он устраивает как музыкантов, так и пользователей.
Многие применяют разные способы доказательств этой теоремы, но я объясню, да простят меня динозавры науки, по-своему.
Возьмем кинопленку. Установлено, что при скорости передачи изображений, равной 24 кадра в секунду, человеческий глаз не улавливает перемену кадров, а смотрит на экран как на полноценное видеоизображение.
Практически точно так же устроено и человеческое ухо. Представьте себе, что у вас в максимально замедленном режиме звучит четыре удара по бочке барабана. При ускорении темпа из этих четырех ударов в одно время просто появится дробь, а при еще большем ускорении (о, чудо!) все четыре удара сольются в один звук. Причем советую поэкспериментировать. Сначала у вас начнется слитие звуков бочки по низким частотам, хотя верхние еще останутся раздельными для каждого из четырех звуков. С увеличением темпа начнут сливаться средние частоты и вскоре верхние. Только когда сольются верхние частоты, вы станете воспринимать звук четырех ударов как полноценный один.
Теперь давайте поставим вместо четырех ударов бочки барабана обыкновенные дискретные значения, из которых состоят наши WAV-файлы. Чем больше частота дискретизации, тем естественней воспринимается звук. Представим, что порог слышимости человека - 20 КГц. То есть, один период звукового колебания на данной частоте равен 1/20000 секунды. При частоте дискретизации в 44,1 КГц электрический сигнал "захватывается" с частотой 44100 раз в секунду. То есть, звуковая волна с частотой 20 КГц "захватывается" примерно 2,2 раза за период при частоте дискретизации 44100 Гц, при ней же волна в 10 КГц "захватывается" 4,4 раза, 1 КГц - 44,1 раз, 100 Гц - 441 раз.
Человеческое ухо по своей реакции имеет аналоговую природу. Здесь его можно сравнить с простой электронной лампой. Помимо времени восприятия основных значений данных, есть еще некоторое время атаки и затухания, и электрический сигнал, имеющий какую-либо частоту просто "сглаживается" в лампе, так как постоянные атаки и затухания не дают какой-нибудь электрической характеристике принять нулевое значение. Поэтому и люди так любят аналоговый звук лампы, так как она во многом повторяет действия уха и близка к природным явлениям. С другой стороны, в любом случае и то, и другое можно описать математическими формулами, если у кого-нибудь хватит на это терпения. Но это будут формулы математического усреднения между атакой, максимальным значением и затуханием.
То есть, мы же слышим звук (или колебания воздуха) с помощью особых рецепторов-волосков, каждый из которых отвечает за свою частоту. На частоте 20 КГц мы слышим нечто среднее между атакой, основным значением и затуханием. Если звук записан на частоте сэмплирования 22,05 КГц и в среднем на период выделяется 1,1 точка, то взятые значения могут быть искажены, так как не всегда приходятся на максимальную амплитуду, в результате чего возникает очень большая погрешность в значениях.
Для того, чтобы правильно описать рабочую электрическую характеристику, энергетикам требуется, как минимум, 4 дискретных значения на период. То есть, для частоты дискретизации в 22,1 КГц более-менее достоверно передается частота... 5525 Гц. Все, что выше, уже идет с большими погрешностями по нарастающей. На частоте 11 КГц - это уже примерно 2 точки на период и так далее.
На частоте дискретизации 22050 Гц можно с небольшими потерями отписывать бас-гитару или большой барабан. Но гитару, у которой многие составляющие тембра находятся в спектральном диапазоне вокруг 7 КГц, на такой частоте качественно не запишешь.
Надеюсь, мы хорошо разобрались с тем, что собой представляет частота дискретизации на самом деле.
Сглаживающие фильтры, которые присутствуют в воспроизводящей технике, в воздухе, в наших ушах, позволяют услышать только результат погрешностей, которые возникают из-за недостоверной информации, передающейся на ЦАП. Чем больше частота дискретизации, тем качественнее и естественнее мы будем ощущать звук.
44,1 КГц - предел качества... Это миф
или реальность?
На самом деле мы воспринимаем инфра- и ультразвуки. Надо сказать, природа нас хорошо защитила от многих воздействий, сузив границы "жизнедеятельности" человека, предоставив другие диапазоны другим существам.
Ультразвук - это упругие волны с частотой выше 20 КГц, которые не слышны человеческим ухом. Давайте верить "Советскому Энциклопедическому словарю", который поведал об ультразвуке следующее: "Ультразвук содержится в шуме ветра и моря, издается и воспринимается рядом животных (летучие мыши, рыбы, насекомые и т. д.), присутствует в шуме машин". А теперь понятие, находящееся в данном кладезе знаний, чуть ниже после "Ультразвука": "Ультразвуковая терапия - применение ультразвука с частотой 500-3000 КГц с лечебной целью. Оказывает механическое, термическое и химическое воздействия ("микромассаж" клеток и тканей), активизирует обменные, иммунные и другие процессы".
То есть, можно сделать вывод, что природный комплекс оказывает свое воздействие на организм на других спектрах частот. Поэтому мы и любим шум ветра, любим бывать на водоемах, так как отдых организма формируется еще и подсознательно от нас.
Любая запись на носитель того же шума ветра больше похожа на эмуляцию, чем на полноценный естественный звук.
Поэтому, говоря о качестве CD и ширине частотного диапазона - по сравнению с природой, он выглядит как граммофон. Хотя при прослушивании в наушниках мы не заметим потерь в звуке, так как записан полный слышимый диапазон.
Кристофер М. ИХИХО,
chris@music-hall.com.ua,
music-hall.com.ua