
Formatos de audio al alcance de simples mortales
Érase una vez un tiempo feliz en que, para escuchar música, solo teníamos que girar el botón de un radio receptor y encontrar una emisora, o bien colocar cuidadosamente la aguja sobre un disco giratorio. Aunque, pensándolo bien, quizás fue aquí cuando empezó la pesadilla de los codecs, los formatos y los numeritos, cuando comenzaron a obligarnos a seleccionar en el aparato la velocidad de giro correcta, reflejada en la carátula y el centro del vinilo (33 1/3, 45 o 78 revoluciones por minuto, entre otras).
La relación entre la reproducción de fonogramas y los numeritos y siglas que lo acompañan no ha cambiado mucho con el tiempo y el desarrollo de los soportes de audio. El rol de la carátula y el centro del disco lo suplen ahora las propiedades y extensión de los ficheros de audio digital, asumidos por la mayoría pero me temo que vagamente comprendidos. El objetivo de este texto es ayudar a esclarecer de qué van esas siglas y números vinculados a los diferentes files de audio.
En los soportes de antaño, desde el disco de vinilo, pasando por la cinta magnética en casete y el open reel hasta la película de cine, el audio implícito era totalmente análogo. Su forma, proporcional a la onda sonora correspondiente, venía reflejada en los diversos soportes mediante la profundidad y forma del surco en el vinilo, la intensidad del flujo magnético en la cinta, y la zanja —de ancho o densidad variable— en la película de cine.
La introducción del audio digital y su empleo para diferentes prestaciones trajeron como consecuencia la aparición de una amplia variedad de formatos. No obstante, existen al menos dos parámetros comunes a todos: la frecuencia de muestreo (sampling frequency) y la resolución.
Al proceso primario de codificación del audio análogo a digital se le denomina PCM (Pulse Code Modulation), y consiste en la subdivisión de la onda sonora en pequeños fragmentos o muestras. Mientras mayor sea su número, mayor definición tendrá la señal digital obtenida. Los valores más comunes son 44.1 kHz, o sea 44100 muestras por segundo, en los discos compactos de audio digital (CDDA); 48 kHz en video; 96 kHz y 192 kHz, en Blue-Ray y soportes profesionales.
A cada muestra se le asigna un valor de resolución en código binario (el lenguaje que entienden las computadoras), proceso denominado cuantización. Este parámetro se expresa en bits y define el rango dinámico de la señal, que es la relación de intensidades entre el sonido más leve y el más potente. El audio registrado en un CD puede alcanzar un rango dinámico de hasta 96 dB (suficiente para abarcar la dinámica de una orquesta sinfónica en su totalidad, desde un pianissimo a un tutti-fortissimo), y corresponde a 16 bits de resolución, que proporcionan 65536 (216) valores para definir cada muestra. Como resultado de este proceso de conversión análogo-digital se obtiene un file de audio sin pérdidas (al menos perceptibles) en formato AIFF (Audio Interchange File Format) para plataforma Mac; WAV, propio del sistema operativo Windows, considerado el más universal de los formatos sin compresión; y LPCM (Lineal Pulse Code Modulation), usado en video.
Esto plantea un problema, y es que los files sin compresión ocupan mucho espacio. Por poner un ejemplo común, un minuto de audio estéreo con 44.1 kHz de frecuencia de muestreo y 16 bits de resolución (formato usado en los CD de audio) pesa unos 10 MB. De ahí la necesidad de adoptar formatos de audio con compresión que ocupan menos espacio de almacenamiento, y son más fáciles de manipular y transmitir en plataformas y redes digitales.

Ilustración: Lissette Batista.
El más popular de estos formatos es sin duda el MPEG-2 Audio Layer III (Moving Picture Expert Group), comúnmente llamado mp3. Al ser un formato con compresión de datos, el archivo sufre pérdidas en su calidad, de mayor o menor grado, en dependencia de la tasa de bits seleccionada durante la conversión del file original. Una velocidad de 128 kb/s (kilobits por segundo) garantiza una calidad media, aceptada por la inmensa mayoría de los usuarios. Valores inferiores deterioran notablemente las propiedades sonoras de cualquier fonograma, en cambio, files comprimidos con bit-rates de entre 256 a 320 kb/s, aunque ligeramente más voluminosos, ofrecen una calidad sonora notablemente superior.
Mientras que los archivos con extensión .mp3 son usados por la mayoría de las aplicaciones reproductoras de audio en sistemas Android, Windows, lectores de discos compactos y emisoras de streaming; los sistemas con tecnología Apple como Ipods, Iphone y ordenadores Mac, incorporan el conocido software iTunes, cuyo fichero de audio nativo es de formato AAC (Advanced Audio Coding), con extensión .m4a. La tienda iTunes vende sus productos ya codificados en este formato específico.
Por defecto, la conversión de files de audio a formato mp3 se basa en el empleo de una tasa de bits constante (CBR o Constant Bit Rate), mientras que el algoritmo de conversión de Apple maneja tasas de bits variables (VBR o Variable Bit Rate), destinando su máximo valor a fragmentos de gran complejidad, y reduciéndolo a medida que el programa se simplifica. De este modo, un archivo en formato AAC puede ostentar una calidad superior, siendo más ligero que su homólogo mp3.
Un poco menos común para los melómanos es el formato FLAC (Free Lossless Audio Codec). Como su nombre indica —Codec de Audio Libre sin Pérdidas—, a pesar de ser un formato comprimido, al restaurarse a su estado original no experimenta pérdidas en la calidad sonora. Otra de sus bondades es la compatibilidad con fonogramas multicanal (cuadrafónicos, 5.1). Sin embargo, un factor en contra es el limitado rango de soportes de reproducción de dispositivos portátiles y equipos y aplicaciones profesionales que lo admiten. Entre los que sí lo aceptan están reproductores como VLC Media Player y Foobar. Un dato a destacar es que la emisora de streaming Tidal transmite sus programas en formato FLAC sin compresión, superando en calidad sonora a sus contrincantes.
Por último, me gustaría referirme a un formato de audio muy usual, el AC-3 (Audio Codec 3), puesto que la inmensa mayoría de los materiales audiovisuales que disfrutamos cuentan con una banda sonora codificada con algoritmos de compresión pertenecientes a los laboratorios Dolby. Por ello, también es conocido como Dolby Digital. Este formato puede ser estéreo o multicanal ya que acepta hasta seis canales de audio.
Los discos DVD de 4.7 GB pueden guardar hasta dos horas de material audiovisual cuya banda sonora, de estar en formato LPCM estéreo, por su gran volumen obligaría a reducir la cantidad de video, dada la limitada capacidad de almacenamiento físico del disco. Mediante el empleo del formato comprimido Dolby Digital o AC-3 quedaría espacio suficiente para incluir no solo una banda sonora estéreo, sino también otras en diferentes idiomas o su variante multicanal 5.1.
El acelerado desarrollo de las tecnologías de grabación, compresión y transmisión de música y las dificultades comerciales para la creación de estándares, han hecho inevitable que debamos lidiar a diario con estas siglas y números mágicos llamados “codecs de audio”, que nos permiten escuchar nuestras canciones favoritas en el emisor o gadget que preferimos para cada momento. Ahora ya conoces las diferencias entre cada uno y a qué hacen referencia. Si, además, eres de los pocos que pueden notarlas con los ojos cerrados, seguramente es porque eres productor, sonidista o músico. Si es el caso, ¿qué esperas para aprovechar esa habilidad natural?