Ajustar la escucha de conferencias para la ciudad

La ciudad tiene mucho ruido, ya ni siquiera podemos decir ruido de fondo, pues es tal el nivel que el ruido no es fondo sino sujeto. El transeúnte que quiere usar el tiempo de transito para escuchar en sus audífonos alguna conferencia o radio novela, se ve en problemas pues las partes leves de la voz son incomprensibles y si se sube el volumen general, las partes fuertes ya incomodan, necesitamos entonces reducir la variación de volumen de la grabación (rango dinámico).

En GNU/Linux podemos usar el Compander de sox , un ajuste inicial sería:

$ sox [archivo_origen] [archivo_destino] compand 0.02,0.20 5:-60,-40,-10 -5 -90 0.1

Un ejemplo:

$ sox The_Power_of_Abstraction-GDVAHA0oyJU.mp3 abstraction_bicicleta.mp3 compand 0.02,0.20 5:-60,-40,-10 -5 -90 0.1

Los parámetros que usa el Compander (compresor+expander) son:

compand attack1,decay1{,attack2,decay2}
[soft-knee-dB:]in-dB1[,out-dB1]{,in-dB2,out-dB2}
[gain [initial-volume-dB [delay]]]

Pueden detallar en estos parámetros aca: http://sox.10957.n7.nabble.com/Compander-help-limiter-td2920.html

La diferencia de los rangos dinámicos en diferentes entornos se puede ver mejor en esta gráfica:

Nota: Para descargar una conferencia de YouTube, Vimeo, SoundCloud, etc puede usar el programa youtube-dl incluso ese programa trae una aplicación para extraer el audio, pero alguna vez no me funcionó entonces uso este script de ffmpeg para extraer el audio a una carpeta con videos de YouTube:

for f in *.mp4; do ffmpeg -i “$f” -vn -c:a libmp3lame -ar 44100 -ac 2 -ab 192k “${f/%mp4/mp3}”; done a una carpeta con videos de YouTube:

for f in *.mp4; do ffmpeg -i “$f” -vn -c:a libmp3lame -ar 44100 -ac 2 -ab 192k “${f/%mp4/mp3}”; done