Содержание
- 1 Цифровое аудио: Полный гайд новичка по записи цифрового звука
- 1.1 1. Начало цифровой эры
- 1.2 2. Цифровые конвертеры
- 1.3 3. Частота дискретизации
- 1.4 Теорема Котельникова (Найквиста—Шэннона)
- 1.5 Минусы высокой частоты дискретизации
- 1.6 4. Разрядность
- 1.7 5. Ошибка квантования
- 1.8 6. Дизеринг
- 1.9 7. Время задержки
- 1.10 Крайняя мера
- 1.11 8. Устройства синхронизации
- 1.12 9. Сжатие Mp3/AAC
- 2 Статьи
- 3 Частота дискретизации и разрядность | Алексей Данилов
- 4 Записывая звук, выбираем оптимальную частоту. Полезная информация
- 5 Частота дискретизации и теорема Котельникова | Гик
- 6 Динамический диапазон всех цифровых форматов, включая DSD – мифы и реальность
- 6.1 Что такое дискретизация
- 6.2 Формат CD и родственные ему форматы Flac – динамический диапазон
- 6.3 Итог по чистоте записи в формате CD
- 6.4 Посмотрим что у нас с форматами высокого разрешения, начнем с Flac:
- 6.5 Дополнительно рассмотрим пару форматов WAVE, с ультравысокой частотой дискретизации
- 6.6 Формат DSD
- 6.7 Итак, начнем… DSD
- 6.8 Осталось рассмотреть формат DSD с более высокими частотами дискретизации
Цифровое аудио: Полный гайд новичка по записи цифрового звука
Когда домашняя запись стала популярной…
Это произошло по одной причине:
Аналоговое оборудование медленно, но верно заменялось…
Новым поколением аудиоинтерфейсов и другого цифрового оборудования, которое было дешевле и проще в использовании, чем раньше.
И с тех пор этот тренд продолжается.
В наши дни… цифровое аудио является стандартом практически для всех студий, как профессиональных, так и любительских.
И при этом удивительно, насколько мало людей действительно понимают, что это такое.
В сегодняшнем посте я приготовил для вас вводный курс по основам цифрового аудио в звукозаписи.
Вот какие 9 тем мы рассмотрим:
- Начало цифровой эры
- Цифровые конвертеры
- Частота дискретизации
- Разрядность
- Ошибка квантования
- Дизеринг
- Задержка
- Устройство синхронизации
- Кодирование mp3
Начнём…
1. Начало цифровой эры
Хотя в наше времяцифровое аудио является стандартом музыки…
Это не всегда было так.
Изначально музыка существовала только в виде звуковых волн.
Затем с развитием технологий открывались способы её конвертации в другие форматы, такие как:
- нотная запись
- электрические сигналы в кабелях
- радиоволны в атмосфере
- нанесение на виниловой пластинке
Но в последнее время, в компьютерную эпоху, цифровое аудио стало основным форматом звукозаписи, позволив с лёгкостью копировать и передавать песни.
Устройство, благодаря которому это стало возможным, называется… цифровой конвертер.
Далее — о том, как он работает…
2. Цифровые конвертеры
В студиях звукозаписи цифровые конвертеры существуют в 2 вариантах:
- как отдельное устройство в топовых студиях или…
- как часть аудиоинтерфейса в домашних студиях.
Чтобы сделать из звука бинарный код, они снимают десятки тысяч снимков (сэмплов) в секунду для построения примерной картинки аналоговой волны.
Эта картинка не совсем точная, поскольку в моменты между сэмплами конвертер должен догадаться, что происходит.
Как видно на графике выше:
- красная линия показывает аналоговый сигнал, а…
- чёрная линия показывает конверсию…
Результаты неидеальны, но достаточны для создания звука отличного качества.
А насколько отличного зависит в основном от…
3. Частота дискретизации
Посмотрите на эту картинку:
Как видите…
Благодаря снятию большего числа снимков в секунду, более высокая частота дискретизации:
- Собирает больше настоящей информации,
- Использует меньше догадок,
- Составляет более аккуратное изображение аналогового сигнала
А в конечном итоге получается лучшее качество звука.
Теперь поговорим о конкретных цифрах:
Стандартная частота дискретизации в профессиональном звуке:
- 44.1 кГц (компакт-диск)
- 48 кГц
- 88.2 кГц
- 96 кГц
- 192 кГц
44.1 кГц является минимальной частотой дискретизации из-за математического принципа, известного как…
Теорема Котельникова (Найквиста—Шэннона)
Для аккуратной записи цифрового аудио конвертеры должны улавливать полный спектр человеческого слуха между 20 Гц и 20 кГц.
Согласно теореме Котельникова…
Улавливание особой частоты требует как минимум 2 сэмпла в цикл… чтобы измерить и высшую, и низшую точки волны.
Это означает, что для записи частот до 20 кГц требуется частота дискретизации в 40 и более кГц. Поэтому частота дискретизации компакт-дисков немного выше, 44.1 кГц.
Минусы высокой частоты дискретизации
Хотя чем выше частота дискретизации, тем выше качество звука… но это получается не просто так.
Минусы — это:
- Требуется большая вычислительная мощность
- Меньшее число дорожек
- Большие аудиофайлы
Так что это постоянный поиск компромисса. Профессиональным студиям проще справляться с высокими частотами дискретизации, поскольку в них установлено лучшее оборудование.
Однако, для большинства домашних студий подходит стандартная частота дискретизации в 48 кГц.
Далее…
4. Разрядность
Чтобы понимать битовую глубину (разрядность), сперва обсудим биты.
Сокращение от binary digit (двоичная единица), бит — отдельная составляющая бинарного кода, либо 1, либо .
Чем больше используется битов, тем больше возможных комбинаций. Например…
Как видно на таблице внизу, из 4 бит можно составить 16 комбинаций.
Когда они используются для кодирования информации, каждому числу присваивается значение.
С увеличением числа битов, число возможных значений растёт экспоненциально.
- 4 бит = 16 возможных значений
- 8 бит = 256 возможных значений
- 16 бит = 16536 возможных значений
- 24 бит = 16777215 возможных значений
В цифровом аудио каждое значение присваивается амплитудам звуковой волны.
Чем больше разрядность, тем выше разница между тихим и громким звуком… и больше динамический диапазон записи.
Общее правило: с каждым “битом” динамический диапазон увеличивается на 6 дБ.
Например:
- 4 бит = 24 дБ
- 8 бит = 48 дБ
- 16 бит = 96 дБ
- 24 бит = 144 дБ
В целом это значит, что… большая разрядность приводит к меньшему количеству шумов…
Потому что при добавлении запаса мощности, полезный сигнал может быть записан более отчётливо относительно шумов.
Далее…
5. Ошибка квантования
Звучит невероятно, что в 24-битовых записях почти 17 миллионов значений, правда?
Но всё же это намного меньше бесконечного числа возможных значений, существующего в аналоговом сигнале.
Практически в каждом сэмпле действительное значение расположено где-то между двумя возможными значениями. Конвертер просто округляет (квантует) их до ближайшего значения.
В итоге получается искажение, известное как ошибка квантования, которое происходит на двух этапах процесса записи:
- в начале, во время аналого-цифрового преобразования
- в конце, во время мастеринга
Во время мастеринга частота дискретизации и разрядность конечного трека зачастую снижаются при преобразовании в конечный цифровой формат (CD, mp3 и т. д.).
Когда это происходит, некоторая информация удаляется и заново квантуется, что ещё больше искажает звук.
Для решения этой проблемы придумано следующее…
6. Дизеринг
При конвертации 24-битного файла в 16-битный используется дизеринг, чтобы скрыть большую часть получающихся искажений…
За счёт добавления “псевдослучайного шума” в аудиосигнал.
Поскольку этот концепт тяжело визуализировать, говоря о звуке, его обычно объясняют с помощью изображений.
Вот как это работает:
Когда цветное фото конвертируют в чёрно-белое, математически высчитывается, какой цветной пиксель должен стать чёрным, а какой — белым…
Также, как высчитывается квантование сэмплов цифрового аудио.
Как видите на иллюстрации ниже, картинка “до” выглядит отстойно, не так ли?
Но благодаря дизерингу…
- небольшое количество белых пикселей случайно вносятся в чёрные зоны…
- небольшое количество чёрных пикселей случайно вносятся в белые зоны…
И благодаря добавлению этого “псевдослучайного шума” в изображение, картинка “после” выглядит гораздо лучше. Концепт аудиодизеринга сходен с этим.
Далее…
7. Время задержки
ОДИН БОЛЬШОЙ НЕДОСТАТОК современных цифровых студий — это задержка по времени, накапливающаяся в потоке сигналов, особенно в ЦЗРС.
Учитывая все происходящие вычисления, для того, чтобы аудиосигнал вышел из системы, требуется от нескольких миллисекунд до нескольких ДЕСЯТКОВ миллисекунд.
- Задержка в 0-11 миллисекунд настолько короткая, что обычный человек её и не заметит.
- При задержке в 11-22 миллисекунд вы слышите раздражающий слэпбек, короткую задержку, к которой надо какое-то время привыкать.
- При задержке более 22 миллисекунд становится почти невозможно играть или петь вместе с треком.
В обычной цифровой цепочке сигналов существуют 4 стадии, влияющие на итоговое время задержки:
- аналого-цифровое преобразование
- буферизация ЦЗРС
- задержка плагина
- цифро-аналоговое преобразование
Аналого-цифровое и цифро-аналоговое преобразование — 2 самых маленьких негативных эффекта, добавляющих максимум 5 миллисекунд к задержке.
Однако…
Буфер ЦЗРС и некоторые плагины (включая “смотрящие вперёд” компрессоры и виртуальные инструменты) могут добавить 20, 30, 40 миллисекунд и даже больше.
Чтобы сохранить минимальный уровень задержки:
- Отключите все ненужные плагины при записи.
- Установите настройки буфера ЦЗРС так, чтобы найти наименьшее время, которое потянет ваш компьютер без лагов.
Вы обратите внимание, что время буферизации измеряется в сэмплах, а НЕ в миллисекундах. Чтобы их сконвертировать:
- Поделите число сэмплов на частоту дискретизации (в кГц), чтобы определить время задержки в миллисекундах.
Например: 1024 сэмпла ÷ 44.1 кГц = 23 мс
Если вам влом заниматься математикой, просто запомните значения для 44.1 кГц:
- 256 сэмплов = 6 мс
- 512 сэмплов = 12 мс
- 1024 сэмпла = 24 мс
В БОЛЬШИНСТВЕ случаев эти шаги должны свести задержки к приемлемому уровню…
Но иногда, если ваше оборудование слишком старое или дешёвое, могут и не привести.
В таком случае…
Крайняя мера
Во многих бюджетных интерфейсах есть крутилка “mix” или “blend”, позволяющая соединять музыку с сессии с “живым сигналом”.
Разделяя сигнал с микрофона/гитары и посылая половину на компьютер, а половину — напрямую в наушники, можно избежать задержек, полностью обходя цепочку сигналов.
Недостаток этой техники… вы слышите живой сигнал абсолютно сухим, без эффектов.
Но есть надежда, что по мере роста производительности компьютеров это перестанет быть проблемой в ближайшем будущем.
Далее…
8. Устройства синхронизации
Когда 2 или более устройств обмениваются цифровыми данными в реальном времени…
Их внутренние часы должны быть синхронизированы, чтобы сэмплы оставались выровненными…
И не появлялись раздражающие щелчки и хлопки.
Для их синхронизации одно устройство служит “главным”, а остальные — “ведомыми”.
В простых домашних студиях главными обычно являются часы аудиоинтерфейса.
В профессиональных студиях, которым необходимы идеальная цифровая конвертация и сложный путь прохождения сигнала…
Вместо этого используется специальное отдельное устройство, известное как цифровое устройство синхронизации (также известное как word clock). По словам многих пользователей, при использовании таких устройств звук улучшается гораздо сильнее, чем можно было бы подумать.
Далее…
9. Сжатие Mp3/AAC
В современном мире сжатые аудиофайлы — это норма цифрового аудио.
Из-за ограниченной вместимости айподов, смартфонов и онлайн-хранилищ все файлы должны весить как можно меньше.
Используя метод “сжатия данных без потерь”, mp3, AAC и другие подобные форматы сжимают аудиофайлы вплоть до 1/10 от их изначального размера.
Процесс сжатия использует принцип человеческого слуха, известный как “слуховая маскировка”…
Благодаря которому можно удалять большую часть музыкальной информации, оставляя при этом приемлемое для большинства слушателей качество звука.
Опытные звукоинженеры разницу, может, и услышат, но простой обыватель — нет.
Точное значение того, как много информации удалится, зависит от битрейта файла.
Чем выше битрейт, тем меньше информации удаляется и больше деталей остаётся.
Например, в mp3:
- 320 кбит/с — максимально возможный битрейт
- 128 кбит/с — рекомендуемый минимальный битрейт
- 256 кбит/с — золотая середина, которую предпочитает большинство
Чтобы найти идеальный формат и битрейт для ВАШЕЙ музыки, всегда смотрите советы конечного сервиса (Айтюнс, Ютьюб, СаундКлауд и т. д.)
Источник: https://ru.ehomerecordingstudio.com/digital-audio/
Статьи
Как люди, непосредственно связанные с AV сферой, мы постоянно говорим об аудио-кодировании и аудиокодеках, а что же это такое? кодек – это, по сути, устройство или алгоритм, способный кодировать и декодировать цифровой аудиосигнал.
На практике аудиоволны, которые передаются по воздуху, являются продолжительными аналоговыми сигналами.
Сигналы преобразуются в цифровой формат устройством, которое называется аналого-цифровой преобразователь (АЦП), а устройство обратного преобразования – цифро-аналоговый преобразователь (ЦАП).
Кодек находится между этими двумя функциями и именно он позволяет откорректировать некоторые важные параметры для успешного захвата, записи и трансляции звукового сигнала: алгоритм кодека, частота дискретизации, разрядность и скорость передачи данных.
Три наиболее популярных аудиокодека: Pulse-Code Modulation (PCM), MP3 и Advanced Audio Coding (AAC). Выбор кодека определяет степень сжатия и качество записи.
PCM – кодек, который используется компьютерами, CD-дисками, цифровыми телефонами и иногда SACD-дисками.
Источник сигнала для PCM сэмплируется через равные интервалы, и каждый сэмпл представляет собой амплитуду аналогового сигнала в цифровом значении. PCM – это наиболее простой вариант для оцифровки аналогового сигнала.
При наличии правильных параметров этот оцифрованный сигнал может быть полностью реконструирован обратно в аналоговый без каких-либо потерь.
Но этот кодек, обеспечивающий практически полную идентичность оригинальному аудио, к сожалению, не очень экономичен, что выражается в очень больших объемах файлов, а такие файлы не подходят для потокового вещания.
Мы рекомендуем использовать PCM для записи цифровых образов для ваших источников или когда вы занимаетесь постобработкой аудио.
К счастью, у нас всегда есть возможность выбрать другой кодек, который может сжимать цифровые данные (по сравнению с PCM) на основании некоторых полезных наблюдений о поведении звуковых волн.
Но в этом случае приходится идти на компромисс: все альтернативные алгоритмы сопряжены с «потерями», так как невозможно полностью восстановить исходный сигнал, но, тем не менее, результат всё равно хорош настолько, что большинство пользователей не смогут уловить разницу.
MP3 – это формат аудио-кодирования с использованием как раз такого алгоритма сжатия цифровых данных, который позволяет сохранять аудиосигнал в меньшие по объему файлы.
Кодек MP3 чаще всего используется пользователями для записи и хранения музыкальных файлов.
Мы рекомендуем применять MP3 для трансляций аудио-контента, так как ему требуется меньшая пропускная способность сети.
AAC – это более новый алгоритм кодирования аудиосигнала, ставший «преемником» MP3. AAC стал стандартом для форматов MPEG-2 и MPEG-4.
По сути это тоже кодек сжатия цифровых данных, но с меньшей, чем у MP3, потерей качества при кодировании с одинаковыми битрейтами.
Мы рекомендуем использовать этот кодек для онлайн трансляций.
Частота дискретизации (кГц, kHz)
Частота дискретизации (или частота сэмплирования) — частота, с которой происходит оцифровка, хранение, обработка или конвертация сигнала из аналога в цифру. Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (сэмплов), взятых через равные промежутки времени.
Измеряется в герцах (Гц, Hz) или килогерцах (кГц, kHz,) 1 кГц равен 1000 Гц. Например, 44 100 сэмплов в секунду можно обозначить как 44 100 Гц или 44,1 кГц.
Выбранная частота дискретизации будет определять максимальную частоту воспроизведения, и, как следует из теоремы Котельникова, для того, чтобы полностью восстановить исходный сигнал, частота дискретизации должна в два раза превышать наибольшую частоту в спектре сигнала.
Как известно, человеческое ухо способно улавливать частоты между 20 Гц и 20 кГц. Учитывая эти параметры и значения, показанные в таблице ниже, можно понять, почему именно частота 44,1 кГц была выбрана в качестве частоты дискретизации для CD и до сих пор считается очень хорошей частотой для записи.
Есть ряд причин для выбора более высокой частоты дискретизации, хотя может показаться, что воспроизводить звук вне диапазона человеческого слуха – пустая трата сил и времени. При этом среднестатистическому слушателю будет вполне достаточно 44,1 – 48 кГц для качественного решения большинства задач.
Разрядность
Наряду с частотой дискретизации есть такое понятие как разрядность или глубина звука. Разрядность – это количество бит цифровой информации для кодирования каждого сэмпла.
Проще говоря, разрядность определяет «точность» измерения входного сигнала. Чем больше разрядность, тем меньше погрешность каждого отдельного преобразования величины электрического сигнала в число и обратно.
С минимальной возможной разрядностью есть только два варианта измерения точности звука: 0 для полной тишины и 1 для звучания в полном объеме.
Если разрядность равна 8 (16), то при измерении входного сигнала может быть получено 28= 256 (216= 65 536) различных значений.
Разрядность закреплена в кодеке PCM, но для кодеков, которые предполагают сжатие (например, MP3 и AAC) этот параметр рассчитывается при кодировании и может меняться от сэмпла к сэмплу.
Битрейт
Битрейт — это показатель количества информации, которым кодируется одна секунда звучания. Чем он выше, тем меньше искажений и тем ближе закодированная композиция к оригиналу. Для линейного PCM битрейт рассчитывается очень просто.
битрейт = частота дискретизации × разрядность × каналы
Для таких систем как Epiphan Pearl, которые кодируют линейный PCM 16-бит (разрядность 16), этот расчет может быть использован для определения, сколько дополнительных полос пропускания может потребоваться для PCM аудио. Например, для стерео (два канала) оцифровка сигнала производится с частотой 44,1 кГц на 16-бит, а битрейт при этом рассчитывается таким образом:
44,1 кГц × 16 бит × 2 = 1 411,2 кбит/с
Между тем алгоритмы сжатия аудиосигнала, такие как AAC и MP3, имеют меньшее количество бит для передачи сигнала (в этом и заключается их цель), поэтому они используют небольшие битрейты.
Обычно значения находятся в диапазоне от 96 кбит/с до 320 кбит/с. Для этих кодеков чем выше битрейт вы выбираете, тем больше аудио бит вы получаете на сэмпл, и тем выше будет качество звучания.
Частота дискретизации, разрядность и битрейты в реальной жизни.
CD-диски, одни из первых наиболее популярных изобретений для простых пользователей для хранения цифрового аудио, использовали частоту 44,1 кГц (20 Гц – 20 кГц, диапазон человеческого уха) и разрядность 16-бит. Данные значения были выбраны, чтобы при хорошем качестве звука иметь возможность сохранять как можно больше аудио на диске.
Когда к аудио добавилось видео и появились DVD, а позднее Blu-Ray диски, был создан новый стандарт. Записи для DVD и Blu-Rays обычно используют линейный формат PCM с частотой 48 кГц (стерео) или 96 кГц (звук 5.
1 Surround) и разрядность 24.
Эти значения были выбраны в качестве идеального варианта, чтобы сохранять аудио с синхронизацией с видео и при этом получать максимально возможное качество с использованием дополнительного доступного дискового пространства.
Наши рекомендации
CD, DVD и Blu-Ray диски преследовали одну цель – дать потребителю высококачественный механизм воспроизведения. Задачей всех разработок было предоставить высокое качество аудио и видео, не заботясь о величине файла (лишь бы он умещался на диск). Такое качество мог обеспечить линейный PCM.
Напротив, у мобильных средств информации и потокового медиа совсем другая цель – использовать максимально низкий битрейт, при этом достаточный для поддержания приемлемого для слушателя качества. Для этой задачи лучше всего подходят алгоритмы сжатия. Теми же принципами вы можете руководствоваться для своих записей.
При записи аудио с видео…
В случае если запись будет использоваться для последующей обработки, выбирайте кодек PCM с частотой 48 кГц и максимальной разрядностью (16 или 24), чтобы обеспечить наилучшее качество аудио. Мы рекомендуем данные параметры для Epiphan Pearl.
При потоковой передаче аудио с видео…
При потоковой передаче или записи для последующей трансляции можно получить хорошее звучание аудио при меньшей полосе пропускания, используя кодеки AAC или MP3 с частотой 44,1 кГц и битрейт 128 кбит/с или выше. Такие параметры гарантируют, что звук будет достаточно хорош и не скажется на качестве трансляции.
Источник: http://www.Epiphan.ru/articles/art_14.php
Частота дискретизации и разрядность | Алексей Данилов
Когда сигнал поступает на АЦП с предусилителя, компрессора, выхода пульта, синтезатора, — он представляет собой электромагнитные колебания.
То есть на вход АЦП приходит некая волна с изменяющимся напряжением (очень маленьких величин). Для сохранения сигнала в файл его нужно «оцифровать», то есть закодировать с помощью единиц и нулей.
В результате получается график волны на экране компьютера.
Даже самый лучший преобразователь имеет погрешность, ведь между нулем и единицей нет промежуточных значений, и график волны будет состоять только из вертикальных и горизонтальных отрезков, без наклонных линий. На графическую прорисовку волны будут влиять высота звука (частота колебаний), его тембр (форма волны) и громкость (амплитуда). Качественный АЦП должен корректно передать системе записи все эти параметры.
Итак, звук поступает в систему дискретно, то есть разделенным мелкие отрезки. От величины этих отрезков зависит точность кодирования аналогового сигнала в цифровой среде. Чем мельче горизонтальная и вертикальная дискретные единицы, тем точнее оцифровка.
Частота дискретизации
Горизонтальное дробление волны дает нам представление о частоте дискретизации, или частоте семплирования.
Чем чаще АЦП фиксирует изменения значений графика волны, тем выше частота семплирования. Собственно, один семпл — это дискретный единичный отрезок, минимальная единица звука.
Чем он короче, тем выше частота дискретизации.
К примеру, значение частоты дискретизации в 44.1 кГц показывает, что в одной секунде записи содержится 44100 семплов.
Мы можем редактировать волну, принимая за минимальный элемент редактирования отрезок длительностью 1/44100 секунды.
При увеличении частоты семплирования до 48 кГц этот отрезок уменьшается до 1/48000 доли секунды, давая возможность более точного воздействия.
Согласование частот дискретизации
Каждый семпл по продолжительности равен предыдущему. Для корректного воспроизведения звука частоты дискретизации файла и системы должны быть идентичны. При добавлении в проект звуковой дорожки с частотой дискретизации, отличной от дискретизации хоста (программы), она должна быть сконвертирована.
Если воспроизводить файл более высокой частоты в системе с более низкой, он будет звучать медленнее, чем должен, и наоборот. Конвертирование сигнала из одной частоты в другую всегда приводит к появлению искажений.
Чтобы «перекроить» звук под новую частоту дискретизации, система должна разбить семплы на более мелкие куски и снова собрать их в единую волну.
Такой процесс может привести в лучшем случае просто к замыливанию звука, в худшем — к появлению щелчков.
Конечно, на встроенных колонках домашнего ноутбука разница будет незаметна. Но если речь идет о работе со звуком на профессиональном уровне, согласование частот дискретизации необходимо.
Не рекомендуется изменять частоту дискретизации в рамках одного проекта. Оправданием повышению дискретизации может быть, например, необходимость обработки файла алгоритмами или плагинами, лучше работающими на высоких частотах.
Поскольку более высокая дискретность предполагает разбиение на более мелкие семплы, точность обработки будет выше, а качество в результате лучше. Но гарантировать эффективность этого метода тоже невозможно: в каждом случае результат будет индивидуальным.
Необходимо каждый раз оценивать, что важнее — эффект от обработки на более высокой дискретности или негативное влияние конвертации.
Если по какой-то причине после завершения работы на частоте 48 кГц вам потребовалось конвертировать сигнал в 44.
1 кГц, сохраните исходный файл на тот случай, если придется повторно вмешиваться в материал (например, для альтернативного мастеринга).
Обработка на более высокой частоте дискретизации даст лучший эффект, чем на низкой.
Разрядность звука
Если горизонтальное дробление волны дает нам представление о частоте дискретизации, то вертикальная дискретизация – это разрядность, отвечающая за достоверную передачу динамических элементов записи. Чем большее количество «ступенек» может зафиксировать преобразователь, тем выше разрядность записанного звукового файла.
Например, волна за отрезок времени может совершить движение одной ступенькой от 0 до 16, а может четырьмя — по 4 единицы за шаг. Более точным представлением будет 16 шагов по единице. Количество ступенек, на которые волна дробится по вертикали, — это и есть разрядность.
Чем выше разрядность конвертора, тем достовернее он передаст сигналы разного уровня громкости. Если мы движемся большими шагами, каждый из которых равен 16 единицам (низкая разрядность), то при громкости входящей волны на уровне 4 график ее будет округлять до нуля.
А если каждая ступенька разрядности равна 4 единицам (средняя разрядность), значение 4 будет зафиксировано на своем уровне, а значения 3 и 5 округлятся до 4. При единичном шаге все эти значения будут находиться на своих ступеньках — 3, 4, 5 (высокая разрядность).
Таким образом, более высокая разрядность АЦП дает возможность детальнее интерпретировать различные значения громкости звука и максимально приблизиться к форме реальной волны.
Разбиение волны на «ступеньки» по вертикали и горизонтали называется квантованием. Иногда частоту дискретизации называют частотой квантования, а разрядность динамическим квантованием, то есть разделением по уровням громкости (динамика).
Естественно, пример с 16 единицами — условность. Конверторы работают на гораздо более высоких значениях. Например, при разрядности 16 бит система может передать 65536 уровней громкости (2 в степени 16). А при 24 битах — 16777216 уровней (2 в степени 24).
Казалось бы, зачем столько? Неужели наше ухо способно различить хотя бы десять тысяч уровней громкости? Напрямую — не может. Скажем, два сигнала с «соседними» значениями даже при разрядности 16 бит мы различить не в состоянии.
Но работа в студии ведется с разнообразными звуками, и некоторые из них имеют значительные перепады по громкости (к примеру, реверберация). Многие процессы требуют тонкой работы с громкостями (например, едва заметное воздействие эквалайзером на спектр).
Для корректной работы нужна система с хорошей разрешающей способностью и по горизонтали, и по вертикали.
Но есть и обратная сторона медали. Высокие значения дискретизации и разрядности делают файлы более объемными, и для их обработки системе требуется больше ресурсов.
Здесь самое время вспомнить про различия между ресурсонезависимыми и нативными системами. Чем выше квантование, тем сильнее загружается компьютер.
Этот фактор более критичен для нативной системы, обремененной обслуживанием операционки и фоновых процессов.
Всегда нужно искать баланс между значениями дискретизации и разрядности и реальными возможностями системы. Не заставляйте ее работать на пределе, оставляйте резерв мощности.
Мы приближаемся к очень важной и мало кому понятной теме, связанной с музыкальным производством. Речь о так называемых шумах квантования. В ближайшее время этому явлению будет посвящен отдельный материал.
Понимание природы шумов квантования дает возможность музыканту и звукорежиссеру разобраться в некоторых непростых вопросах, связанных с записью музыки в цифровой среде.
Поскольку ввиду дороговизны и сложности в обслуживании аналогового оборудования подавляющее большинство музыкантов работает прежде всего именно в цифровых системах записи, эта тема так или иначе затрагивает всех.
Следите за обновлениями блога, подписывайтесь на новые статьи, чтобы совершенно бесплатно получать их на электронную почту.
Также хочу напомнить, что очень много познавательной практической и теоретической информации содержится в моей книге «Академия Мюзикмейкера», которую без посредников можно приобрести на сайте MusicMaker.Pro.
Источник: http://danalex.ru/sample_rate_bit_depth/
Записывая звук, выбираем оптимальную частоту. Полезная информация
Не только новичкам, но и некоторым энтузиастам, занимающихся звуком много лет, покажется откровением тот факт, что банальный процесс записи сопровождается сложнейшими физическими явлениями. Одним из таковых называют дискретизацию.
Согласно определению, она представляет собой процесс преобразования непрерывной функции в дискретную. Людям, далёким от науки, это понять сложно, тем более, здесь задействована квантовая физика – самая сложная из существующих на сегодняшний день.
Но профессиональные звукорежиссёры, например, работающие в московской студии звукозаписи «Интервал», знают, что такое частота дискретизации звука, какая лучше применима в тех или иных случаях.
Почему? Потому что от этого явления зависит конечное качество записываемой музыки. В кассетно-плёночный период эти нюансы, ввиду ограниченной технической оснащённости, опускались.
Но в современном высокотехнологичном цифровом мире частота дискретизации звука имеет значение при создании музыки и демонстрации её слушателям.
Детализация понятий
Что такое разрядность и частота дискретизации, какая лучше? Ответ на данный вопрос, несмотря на сложность природы этих явлений, получить можно. При этом нет необходимости штудировать учебники по физике.
Достаточно вспомнить, что советскими полуподпольными звукорежиссёрами, записывающими рок и другую музыку, эти показатели определялись на интуитивном уровне. Дискретизацию ещё называют сэмплированием. Это определение более понятно для музыкантов.
Её частота подразумевает интенсивность процессов в тот момент, когда аналоговый сигнал преобразуется в цифровой. Среди них хранение данных, конвертация, и непосредственно оцифровка.
Частота дискретизации измеряется в герцах. Ориентиром в её изучении является теорема Котельникова. Её автор раскрывает суть дискретизации. Согласно теореме, она ограничивает интенсивность оцифрованного сигнала до половины собственной величины.
Частота дискретизации. В чём её значение для звукозаписи
Дискретизация по времени – это процесс, который непосредственно связан преобразованием аналогового сигнала в цифровой. Наряду с ней происходит квантование данных по амплитуде. Дискретизация по времени означает измерение сигнала в момент всей его передачи.
В качестве единицы берётся один сэмпл. Если на словах это не совсем понятно, то на примере выглядит более убедительно. Допустим, частота дискредитации равняется 44100 Гц – та самая, которая применялась на аудио-CD.
Это означает, что сигнал измеряется 44100 раз в течение одной секунды.
Аналоговый сигнал по своей насыщенности всегда превосходит цифровой. И его преобразование – это неизбежная потеря в качестве.
Частота дискретизации служит своеобразным ориентиром: чем она выше, тем ближе качество цифрового звука к аналоговому. Это явственно просматривается в списке ниже. Он показывает, какая частота звука лучше.
Изучая его, вы увидите непосредственную взаимосвязь дискретизации и качества трека:
- 1. 8000 Гц. Данная частота характерна для телефонных разговоров и записи речи на простой по набору функций диктофон. Используется на звуке, преобразовываемом через кодек Nellymoser.
- 2. 22050 Гц применяется в радиовещании.
- 3. 44100Гц. Как уже упоминалось выше, данная частота характерна для Audio CD, и этот показатель долгое время отождествлялся с наиболее высоким уровнем качества. И сегодня формат не утрачивает своих позиций.
- 4. 48000 Гц. Это форматы DAT и DVD, пришедшие на смену AUDIO.
- 5. 96000 – DVD-аудио MLP-5,1.
- 6. 2822 400 ГЦ – высокотехнологичный формат SACD Super Audio.
Список чётко указывает на то, какая частота звука лучше. К тому же технологии на месте не стоят, и появляются новейшие форматы.
Но прежде чем строить далеко идущие планы, следует учесть один очень весомый нюанс.
Его суть проста: чем выше частота дискретизации, тем сложнее её достичь технологически. Для этого необходимо:
- обеспечить высокую интенсивность передачи цифровых потоков. А это возможно далеко не на каждом интерфейсе. И чем больше каналов задействовано в записи (а это характерно для музыкальных ансамблей), тем процесс сложнее;
- иметь на вооружении процессор, способный производить мощные вычислительные операции. Но даже в самых современных образцах возможности для получения звука сверхвысокого качества ограничены;
- использовать для записи компьютерную технику, обладающую большим объёмом оперативной памяти.
Учитывая вышеизложенную информацию, неудивительным является тот факт, что частота звука, равная 44100 Гц, продолжает оставаться наиболее востребованной и сегодня.
Она десятилетиями удовлетворяет даже самые взыскательные запросы к качеству, и вместе с тем имеются все технические возможности для её достижения. Последний фактор является определяющим как для рядовых пользователей, так и для большинства звукозаписывающих студий.
Даже зная, какая частота звука лучше, чтобы достигнуть её, необходимо позаботиться о технической оснащённости.
Источник: https://studiointerval.ru/stati-i-novosti/zapisyvaya-zvuk-vybiraem-optimalnuyu-chastotu-poleznaya-informatsiya
Частота дискретизации и теорема Котельникова | Гик
Часто производители аудио аппаратуры, особено наушников, в процессе пиара своей продукции активно продвигают “кристальную чистоту” звука и широчайший частотный диапазон, который не только за 20 кГц переваливает, но и в некоторых случаях доходит даже до 100 кГц.
Конечно это имеет свои плюсы, даже не смотря на то, что выше 20кГц мы не слышим, а то и еще меньше. Но есть определенные проблемы, которые связанны с понятием частота дискретизации и вытекающие из теоремы Котельникова.
Они в одночасье поставили жирный крест на применении слова “качественно” для большинства аудио-форматов и аудио устройств в моих глазах.
Любой процесс в природе является непрерывным. Например звуковой сигнал принятый микрофоном и преобразованный в электрический (аналоговый) сигнал — непрерывен.
Термин “Аналоговый сигнал” подчеркивает, что такой сигнал “аналогичен”, т.е. полностью подобен порождающему его процессу, или в данном случае звуку.
И непрерывный он не потому что будет длиться вечно, а потому, что его значение можно измерять в любые моменты времени. А между этими моментами сигнал будет продолжать непрерывно меняться.
Что такое частота дискретизации?
Как только встает вопрос о переводе аналогового сигнала в цифровой, сразу возникает понятие дискретизации, т.е. разбиение непрерывного сигнала на кусочки по времени. Делается это непосредственно в процессе преобразования.
Через равные промежутки времени, называемые шагом дискретизации Δ, Аналогово-Цифровой-Преобразователь (АЦП) измеряет значение сигнала, поступающего на его вход и преобразует это значение в цифровой вид. То, как часто осуществляется измерение величины аналогово сигнала и называется частотой дискретизации.
Какая частота дискретизации считается достаточной?
Товарищ Котельников, еще в 1933 в работе «О пропускной способности эфира и проволоки в электросвязи» создал фундаментальную, для цифровой техники теорию, которая обычно формулируется следующим образом:
Любой непрерывный сигнал u(t) с конечным спектром (имеющим максимальное значение частоты F) можно представить в виде дискретных отсчетов u(kΔt), частота дискретизации которых должна быть выбрана не менее чем в два раза выше максимального значения спектра сигнала: f ≥ 2F, передать его по линии связи, а затем восстановить исходный аналоговый сигнал.
Говоря проще, для того чтобы можно было правильно воспроизвести (восстановить) аналоговый сигнал из цифрового вида, достаточно, чтобы частота дискретизации была вдвое выше максимальной частоты в сигнале.
Верхний порог слышимости человека принято ограничивать частотой в 20кГц. Из теоремы Котельникова следует, что для правильного воспроизведения сигнала частотой 20 кГц достаточно частоты дискретизации в 40кГц. Если заглянуть в свойства подавляющего большинства аудио файлов, то можно увидеть строчку:
Почему именно 44.
1 кГц?Википедия отвечает так:“Эта цифра выбрана компанией Sony из соображений совместимости со стандартом телевещанияPAL, за счёт записи 3 значений на линию картинки кадра x588 линий на кадр x25 кадров в секунду, и достаточности (по теореме Котельникова) для качественного покрытия всего диапазона частот, различаемых человеком на слух (20 Гц — 20 кГц).”
При частоте дискретизации в 44.1кГц шаг дискретизации Δ составляет всего 0.00002267=22.67*10-6 секунды или 22.67 микросекунды. Это время между двумя точками сигнала.
Вроде все нормально, так чего же тут не так?
Начнем с частот, кратных частоте дискретизации. На частоте 441 Герц при нашей частоте дискретизации (44.1 кГц), на один период приходится 100 точек.
Чтож, тут нет никаких претензий, синусоида идеальная. Если же повысить частоту на порядок, т.е. в 10 раз, то эти же 100 точек будут формировать уже не 1, а 10 периодов.
И даже в этом случае Будет формироваться сигнал очень похожий на синусоиду.
А вот на частоте 22050, т.е. наивысшей частоте, удовлетворяющей теореме Котельникова (при частоте дискретизации 44.1кГц) на 100 точек приходится 50 периодов колебаний.
Эти сигналы генерировались в программе Audacity.
И по началу создалось впечатление, что точек там достаточно, просто масштаб не позволяет разглядеть и поэтому так все угловато…
Источник: https://audiogeek.ru/chastota-diskretizacii-teorema-kotelnikova/
Динамический диапазон всех цифровых форматов, включая DSD – мифы и реальность
Рассмотрим такие характеристики как: реальный динамический диапазон для форматов DSD, величину фазового шума и ошибки дискретизации для всех цифровых форматов в общем.
В характеристиках звуковоспроизводящей аппаратуры часто приводят такие характеристики как:
- Динамический и частотный диапазон
- Отношение сигнал\шум
- И т.д.
Но очень многое упускается.
Цены на качественные наушники для музыки (в 2019 году):
- Дискретизация во Flac;
- Форматы WAVE, с ультравысокой частотой дискретизации;
- Дискретизация формата DSD;
- DSD с более высокими частотами дискретизации;
- Итог, 3 важных вывода и суть статьи;
Что такое дискретизация
Дискретизация делает дискретным сигнал во времени (в отличие от квантования, которое делает дискретными амплитуды сигналов).
Все знают, что такое разрядность аудио и цапов (ацп).
Чем выше разрядность аудиоинформации и цапа (ацп), тем выше: качество, лучше динамический диапазон и отношение сигнал\шум.
Мало кто задумывается, что квантование на временной оси или правильнее говорить — дискретизация, так-же вносит свой вклад в динамический диапазон и привносит цифровой шум (об этом мало пишут в сети).
Ошибка дискретизация в этом смысле похожа на ошибку квантования — чем выше частота дискретизации и, таким образом, больше информации для цифрового представления сигнала, тем лучше качество. Чаще всего меломаны ограничиваются лишь информацией о (теоретическом) частотном диапазоне, а зря! =)
Формат CD и родственные ему форматы Flac – динамический диапазон
Рассмотрим для начала любимый формат CD и родственные ему форматы Flac. Динамический диапазон рассчитывается очень просто — он равен 6дБ на 1 бит информации, при импульсно кодовой модуляции использующейся в этих форматах.
Для компакт диска динамический диапазон таким образом равен 16бит х 6дБ = 96дБ. Соответственно величина ошибки квантования равна величине младшего разряда и для 16бит динамического диапазона цифровой (теоретический) шум квантования составит -96дБ.
Мы разобрали квантование по амплитуде и это еще не все характеристики цифрового аудио.
В прошлых своих обзорах я уже рассказывал о проблемах связанных с дискретизацией аудио в компакт диске и его реальном частотном диапазоне. Напомню. Диапазон CD (теоретический) составляет 20Гц-20000Гц.
С нижними частотами все в порядке. Проблемы возникают при оцифровке высоких частот. Дело в том что период максимальной (по теореме Котельникова-Шеннона или известная как «частота Найквиста») частоты 22050Гц, будет записан всего двумя цифрами.
Это и есть частота дискретизации которая равна для компакт диска 44100Гц.
Если сравнить количество информации доступное для записи максимальной частоты 22050Гц и минимальной для CD частоты в 20Гц, на ум приходит очень важный и простой вывод — различные частоты записываются с разным качеством.
Понятно так же, что если нижняя частота запишется с высоким качеством, то верхние частоты, совершенно логично, запишутся с качеством плохим. Вопрос только в том насколько плохое это качество.
Чтобы посчитать величину шума дискретизации подойдет формула от оценки шума квантования. Предварительно нужно знать величину периода (целое число) искомой частоты и расчитать требуемое количество бит кодирующих фазу частоты.
Ниже представлена таблица где приведены частоты с уменьшением на октаву, плюс самая низкая частота (кодируемая, как мы помним с избытком качества), далее следует величина периода, минимальная 2р, здесь и далее указывается число единиц информации кодирующих один период частоты и разрядность в битах необходимая для кодирования одного периода при этой частоте дискретизации (ограничением для количества бит на фазу является как раз частота дискретизации). В конце приводится то что нам нужно — величина (теоретическая) фазового шума (ошибка дискретизации) для определенной частоты:
CD 44100 Hz 16bit
- 22050 Hz 2p(1b) -6дБ
- 11025 Hz 4p(2b) -12дБ
- 5512 Hz 8p(3b) -18дБ
- 2756 Hz 16p(4b) -24дБ
- 20 Hz 2205p(11b) -66дБ
Итак, значения шума дискретизации прямо сказать обескураживающие =). Недаром эти характеристики производители аппаратуры не указывают вообще.
Итог по чистоте записи в формате CD
В формате CD чисто запишутся только низкие частоты с отношением сигнал\шум ниже примерно -45дБ.
Средние запишутся уже с высоким уровнем фазового шума.
На высокие частоты уже практически ничего не остается… Напомню, что шум квантования всего -96дБ — его то и указывают производители техники и в описании форматов.
Посмотрим что у нас с форматами высокого разрешения, начнем с Flac:
Flac 96000 Hz 24 bit
- 24000 Hz 4p(2b) -12дБ
- 12000 Hz 8p(3b) -18дБ
- 6000 Hz 16p(4b) -24дБ
- 3000 Hz 32p(5b) -30дБ
- 20 Hz 4800p(13b) -78дБ
Flac 192000 Hz 24 bit
- 24000 Hz 8p(3b) -18дБ
- 12000 Hz 16p(4b) -24дБ
- 6000 Hz 32p(5b) -30дБ
- 3000 Hz 64p(6b) -36дБ
- 20 Hz 9600p(14b) -84дБ
Видно, что с увеличением частоты качество становится лучше, но не на много.
Дополнительно рассмотрим пару форматов WAVE, с ультравысокой частотой дискретизации
WAVE 384000 Hz 32 bit
- 24000 Hz 16p(4b) -24дБ
- 12000 Hz 32p(5b) -30дБ
- 6000 Hz 64p(6b) -36дБ
- 3000 Hz 128p(7b) -42дБ
- 20 Hz 19200p(15b) -90дБ
WAVE 768000 Hz 32 bit
- 24000 Hz 32p(5b) -30дБ
- 12000 Hz 64p(6b) -36дБ
- 6000 Hz 128p(7b) -42дБ
- 3000 Hz 256p(8b) -48дБ
- 20 Hz 38400p(16b) -96дБ
Результаты уже значительно лучше, но все еще не идеальные =) Понятно что форматы с сверхвысокой частотой еще недоступны практически ни кому.
Формат DSD
Теперь обратим внимание на самый спорный и интересный в плане качества формат DSD, использующийся в SACD. Во первых здесь используется не импульсно-кодовая модуляция, а плотностно импульсная. Это означает что весь сигнал и по амплитуде и во времени кодируется потоком однобитных значений.
От сюда следует вывод что квантование симметрично дискретизации и, следовательно шум квантования, будет равен шуму дискретизации. И то и другое (в данном случае это одна величина) представляет интерес.
Итак, начнем… DSD
DSD64
- 2.822.400 Hz 1 bit
- 22050 Hz 128p(7b) -42дБ
- 11025 Hz 256p(8b) -48дБ
- 5512 Hz 512p(9b) -54дБ
- 2756 Hz 1024p(10b) -60дБ
- 20 Hz 141120p(18b) -108дБ
Результаты расчетов впечатляют — это действительно формат высокого качества! Здесь относительно низкий уровень шумов на высоких частотах, на средних частотах этот показатель еще лучше, а на низких качество вообще выше всяких похвал. На высоких частотах начальный формат DSD оставляет позади даже WAVE 768000 Гц!.
Осталось рассмотреть формат DSD с более высокими частотами дискретизации
DSD128
- 5.644.800 Hz 1 bit
- 22050 Hz 256p(8b) -48дБ
- 11025 Hz 512p(9b) -54дБ
- 5512 Hz 1024p(10b) -60дБ
- 2756 Hz 2048p(11b) -66дБ
- 20 Hz 282240p(19b) -114дБ
DSD256
Источник: https://headphonesbest.ru/poleznaya-infa/16774dinamicheskij-diapazon-vseh-cifrovyh-formatov-vkljuchaja-dsd-mify-i-realnost.html