¿Cómo funciona la compresión de audio y qué es el audio “sin pérdida”?

Esta misma semana, Spotify comenzó a probar archivos de audio “sin pérdidas”. Pero, ¿qué es exactamente el audio “sin pérdidas” y cómo funciona la compresión de audio digital?

¿Cómo funciona la compresión de audio?

montaje en rack de compresión de audio

El objetivo de la compresión de audio es reducir la cantidad de bits necesarios para reproducir con precisión un sonido analógico. El primer proceso que veremos se llama “con pérdida”. La compresión con pérdida es una técnica unidireccional que desecha datos no críticos para ahorrar espacio. Estas técnicas son los métodos más comunes utilizados para comprimir archivos de audio, apareciendo en archivos MP3, AAC y WMA por igual. Hay dos lugares en los que los códecs con pérdida buscan guardar bits: velocidad de bits y psicoacústica.

Tasa de bits

señal-cuantificada-de-compresión-de-audio

La tasa de bits mide la cantidad de bits que se utilizan para codificar un solo segundo de audio. Por ejemplo, si usamos codificación de baja calidad de 8 kilobits por segundo (kbps), nuestro algoritmo se limita a usar solo 8 kilobits de datos para describir cada segundo de audio. Es como intentar describir una fotografía a todo color con solo unos pocos cientos de píxeles. Puede que obtenga los trazos generales correctos, pero en general verá una imagen muy degradada. Si usamos una tasa de bits de mayor calidad, como 192 kbps, tenemos mucho espacio para cubrir detalles matizados. Para volver a nuestro ejemplo fotográfico, ahora tenemos suficientes píxeles para describir las distintas luces, sombras y colores de una imagen. Una tasa de bits alta no determina la calidad de una grabación por sí sola, pero una tasa de bits baja puede limitar gravemente la calidad de salida.

Psicoacústica

512px-psm_v14_d076_auditory_canal_bones

La psicoacústica es la ciencia de cómo el cerebro comprende los sonidos. Al manipular peculiaridades conocidas en la forma en que los humanos percibimos el sonido, los algoritmos de compresión pueden eliminar inteligentemente detalles que la mayoría de los oídos humanos no se perderán. El objetivo es “redondear” la información que no cambiará la calidad de audio percibida de una pista, eliminando juiciosamente solo la información sin importancia.

Por ejemplo, podrías saber el rango típico de audición humana está entre 20 Hz y 20 kHz. Obviamente, los sonidos fuera de ese rango se pueden eliminar. Además, el rango más detallado de audición humana se encuentra entre 100Hz y 4kHzy eliminar los sonidos silenciosos fuera de esos rangos de frecuencia hace un daño mínimo a la calidad de una grabación. Podemos hacer un truco similar con sonidos muy contrastantes. Si un sonido muy fuerte y un sonido muy bajo se reproducen al mismo tiempo, el sonido bajo es mucho más difícil de percibir de lo que sería por sí solo. Los codificadores aprovechan este “enmascaramiento de sonido” para eliminar el sonido silencioso, ahorrando bits en el proceso.

La frecuencia también puede afectar qué tan bien percibimos los sonidos. Por ejemplo, un ritmo de batería persistente de baja frecuencia tiende a ahogar los armónicos más delicados y de alta frecuencia de los instrumentos melódicos. Y el enmascaramiento de sonido es especialmente eficaz por encima de 15 kHz, donde el oído humano suele ser menos sensible para empezar.

Los esquemas de compresión de audio comunes, como MP3, aprovechan la gama completa de posibilidades de compresión mientras intentan permanecer lo más fiel posible a la grabación original. Por supuesto, algunas personas sienten que eliminar estas frecuencias daña seriamente la grabación. Por eso existen estándares de compresión sin pérdidas.

¿Qué es el audio “sin pérdidas”?

auriculares-de-compresión-audio

El objetivo de la compresión de audio sin pérdida es reducir el tamaño del archivo sin modificar el audio original. Estos códecs no utilizan ninguna de las técnicas de compresión permanente anteriores, sino que se centran en métodos de compresión de datos totalmente reversibles. Utilizan técnicas de compresión sin pérdidas tomadas de algoritmos de compresión de archivos como ZIP para eliminar datos redundantes y preservar la integridad de la información subyacente. Dos códecs de audio sin pérdida populares, FLAC y Apple Lossless (ALAC), utilizan esquemas basados ​​en compresión ZIP.

Centrarse en la compresión de datos solo significa preservar muchos de los detalles que MP3 y otros estándares con pérdida eliminarían. Si tiene oídos agudos y una configuración de audición de alta calidad, la diferencia puede ser palpable.

Sin embargo, la compresión sin pérdida no solo es buena para escuchar: también es una gran herramienta de almacenamiento. Al igual que no querría que un JPG de 72 ppp sea la única copia digital de las fotografías de Ansel Adam, no queremos solo MP3 de 128 kbps de “Kind of Blue”. Los estándares sin pérdida como FLAC nos permiten almacenar audio de manera eficiente sin desechar datos potencialmente valiosos. También facilitan la remasterización y la redistribución de ese audio, ya que comenzar con masters sin compromisos significa un producto terminado de mayor calidad.

Conclusión: ¿Puedes notar la diferencia?

Los formatos de audio sin pérdida permiten grabaciones con mejor sonido. Pero a veces las diferencias entre un MP3 de alta calidad y un archivo sin pérdidas son casi imperceptibles, especialmente para el oído inexperto. Si desea ver si sus auriculares (y oídos) están lo suficientemente listos para notar la diferencia, NPR tiene una prueba divertida; solo tenga en cuenta que los audífonos baratos y los parlantes para computadoras portátiles no podrán reproducir las sutiles diferencias entre el audio sin pérdida y los MP3. Para un análisis más serio de los códecs, consulte Calificaciones del codificador de SoundExpert.

¿Es útil este artículo?

¡Ayúdanos a correr la voz!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *