Ответ 1
Во-первых, https://www.google.com/?q=mp3+cutoff+frequency может быть очень полезным.
Во-вторых, почти все MP3 кодируются с использованием предустановок с вполне стандартными многофазными фильтрами нижних частот. Поскольку на самом деле невозможно достичь сжатия без потерь с MP3, то теряется на самом деле более высокие гармоники базовых частот (см. бПФ, DCT, вейвлет-преобразования и т.д.); фильтр применяется таким образом, чтобы результаты более позднего анализа спектра Фурье были более согласованы с диапазоном слуха человека (т.е. не анализируемые/маскируемые частоты вообще исключаются из анализа). На самом деле невозможно добиться высокого сжатия без обрезания/серьезного искажения более высоких частот, поскольку именно они занимают большую часть пространства в битовом потоке.
Конечно, без отсечения ограничение в частотной области будет менее точным, но это все равно произойдет. Отсечка применяется, среди прочих причин, так что артефакты сжатия генерируются вне диапазона психоакустического слуха.
Для справки - проведите спектральный анализ потока (достаточно SA в реальном времени с клоном Winamp, если более высокие частотные диапазоны достаточно насыщены, вы также можете просто сделать спектрограмму, если у вас есть инструменты), и найти точку отсечения. В приведенном ниже примере обрезание происходит при 15 кГц, что сообщает мне, что поток был изначально сжат при 128 кбит/с; Я бы даже зашел так далеко, чтобы сказать, что на самом деле можно различать & lt; = 128 кбит/с потоков по слуху со многими видами музыки (драм-н-бейс и другие жанры электронной музыки с множеством высоких частот приходят на ум).
Наиболее распространенные срезы: (обратите внимание, что они являются "жесткими" в CBR и "мягкими" в ABR/VBR)
- 128 кбит/с: 15-16 кГц (очень слышно на рок/электронной музыке! Эффект "потери места")
- 192 кбит/с: ~ 19 кГц (в большинстве случаев едва слышны, большинство считают прозрачными)
- 256-320 кбит/с:> ~ 20 кГц (неразборчиво)
Да, я знаю, что некоторые люди могут слышать выше 20 кГц, но эффект маскировки, появляющийся в музыке, плюс фактическое время отклика динамиков означает, что в реальной музыке обрезание 20 кГц не имеет отношения к качеству звука.
Источник: собственный поиск в качестве звукоинженера плюс https://web.archive.org/web/20150313010213/http://www.whatinterviewprep.com/prepare-for-the-interview/spectral-analysis/ в качестве дополнительной ссылки