SoXr Resampler: Conversión de Frecuencia de Muestreo Audiófila para WAV

Descubre cómo CleverUtils.com utiliza la librería SoXr con precisión de 28 bits y dithering Shibata para ofrecer conversiones WAV sin artefactos — el mismo motor de confianza de herramientas audiófilas como SoX, foobar2000 y JRiver.

Convertir a WAV con SoXr

El remuestreo SoXr se aplica automáticamente a cada conversión

Audio WAV

Toca para elegir tu archivo

o

Supports M4A, WAV, FLAC, OGG, AAC, WMA, AIFF, OPUS • Max 100 MB

Remuestreo SoXr aplicado automáticamente. Archivos eliminados en 2 horas.

¿Qué es el Remuestreo de Audio?

Cuando conviertes audio de una frecuencia de muestreo a otra (p. ej. un MP3 a 44,1 kHz → WAV a 48 kHz para edición de vídeo), cada muestra debe ser recalculada en una nueva cuadrícula temporal. Este proceso se llama remuestreo.

Un enfoque ingenuo — simplemente eliminar o duplicar muestras — genera clics audibles y aliasing. Los remuestreadores profesionales usan interpolación matemática (típicamente filtros FIR polifásicos) para reconstruir una señal continua a partir de muestras discretas y volver a muestrearla a la nueva frecuencia. La calidad de esta interpolación determina si tu audio se mantiene transparente o adquiere artefactos.

Concepto clave: Según el teorema de Nyquist-Shannon, cualquier señal de banda limitada muestreada por encima del doble de su frecuencia más alta puede reconstruirse perfectamente. El remuestreo aprovecha este teorema — un remuestreador de alta calidad puede cambiar frecuencias sin degradación audible.

¿Qué es SoXr?

La SoXr (SoX Resampler Library) es un motor de remuestreo de código abierto y calidad audiófila, desarrollado originalmente para la herramienta de línea de comandos SoX (Sound eXchange). Utiliza un algoritmo polifásico basado en FFT que produce resultados prácticamente indistinguibles de la señal original.

SoXr es utilizado por software de audio profesional como foobar2000, JRiver Media Center, MPV y VLC. CleverUtils.com integra SoXr a través del filtro aresample de FFmpeg, aplicándolo a cada conversión WAV de forma automática.

Parámetro Valor Qué hace
MotorSoXr (CR64)Cálculo en coma flotante de doble precisión de 64 bits
Precisión28 bits~168 dB de relación señal/ruido — muy por encima del suelo de ruido audible
DitheringShibataRuido con forma psicoacústica que desplaza los artefactos de cuantización lejos del pico de sensibilidad auditiva de 1–5 kHz
Anti-aliasingAutomáticoFiltro paso bajo pronunciado que previene el aliasing al reducir la frecuencia

SoXr vs el Remuestreador Predeterminado de FFmpeg

FFmpeg incluye dos backends de remuestreo: el predeterminado swresample (SWR) y el opcional soxr. Así se comparan:

Aspecto swresample (predeterminado) SoXr
AlgoritmoSinc con ventana Kaiser (fase lineal)Polifásico sobremuestreado basado en FFT
Precisión interna16 bits (predeterminado) o float 32 bitsDouble 64 bits (motor CR64)
Rechazo de aliasingBueno (−100 dB típico)Excelente (−168 dB con precision=28)
DitheringTriangular (espectro plano)Shibata (con forma de ruido, menos audible)
VelocidadMás rápidoLigeramente más lento (~10–15% más CPU)
Rizado en banda de pasoMedible cerca de NyquistInsignificante
Ideal paraStreaming en tiempo real, reproducción de vídeoMasterización, archivo, distribución

Conclusión: swresample está optimizado para velocidad y es perfectamente válido para reproducción en tiempo real. SoXr está optimizado para calidad y es la elección correcta cuando produces un archivo que se conservará, distribuirá o editará más adelante — exactamente lo que hace un conversor.

El Dithering Shibata Explicado

Cuando el audio se convierte entre profundidades de bits (p. ej. procesamiento interno en float de 32 bits → salida WAV a 16 bits), los errores de redondeo generan ruido de cuantización. El dithering añade una pequeña cantidad de ruido antes del redondeo para eliminar los patrones de distorsión más molestos.

No todos los ditherings son iguales. El dithering triangular estándar (TPDF) distribuye el ruido uniformemente por todo el espectro de frecuencias. El dithering Shibata utiliza modelado de ruido psicoacústico para desplazar ese ruido a rangos de frecuencia donde el oído humano es menos sensible:

Tipo de dither Distribución del ruido Audibilidad
Ninguno (truncamiento)Sin ruido añadidoPeor — distorsión armónica audible
Rectangular (RPDF)Plano, aleatorioElimina la distorsión, suelo de ruido plano
Triangular (TPDF)Plano, no correlacionadoMejor — sin ruido de modulación
Shibata (con forma de ruido)Desplazado lejos de 1–5 kHzMenos audible — aprovecha la curva auditiva

Por qué importa: El oído humano es más sensible entre 1–5 kHz (la curva de Fletcher-Munson). El dithering Shibata desplaza el ruido de cuantización hacia la región de alta frecuencia menos sensible por encima de 10 kHz, haciéndolo prácticamente inaudible incluso en equipos de monitorización de alta gama.

¿Cuándo Ocurre el Remuestreo?

SoXr se aplica automáticamente a cada conversión WAV en CleverUtils.com, pero su impacto es más significativo en estos escenarios:

Escenario Ejemplo Impacto de SoXr
Reducción de hi-resFLAC a 96 kHz → WAV a 44,1 kHzCrítico — previene artefactos de aliasing
Música → frecuencia de vídeoMP3 a 44,1 kHz → WAV a 48 kHzImportante — conversión de frecuencia limpia
Reducción de vozPodcast a 48 kHz → WAV a 22,05 kHzImportante — preserva la claridad del habla
Conversión a la misma frecuenciaMP3 a 44,1 kHz → WAV a 44,1 kHzMínimo — el dithering sigue aplicándose en cambios de profundidad de bits

La mayor diferencia de calidad se produce durante la reducción de frecuencia — cuando la frecuencia objetivo es menor que la fuente. Sin el anti-aliasing adecuado (que SoXr gestiona automáticamente), las frecuencias por encima del nuevo límite de Nyquist se replegan al rango audible como distorsión.

Precisión de 28 bits: Qué Significa

El parámetro precision=28 de SoXr establece el cálculo interno en 28 bits efectivos usando el motor CR64 (constant-rate, 64-bit). Esto se traduce en aproximadamente 168 dB de relación señal/ruido.

Para contextualizarlo:

  • Audio a 16 bits tiene ~96 dB de rango dinámico
  • Audio a 24 bits tiene ~144 dB de rango dinámico
  • SoXr a precision=28 calcula a ~168 dB — 24 dB por debajo del suelo de ruido del audio a 24 bits

Esto significa que el propio proceso de remuestreo introduce cero ruido audible, incluso para masters a 24 bits. El cálculo interno del remuestreador es más silencioso que el sonido más silencioso que cualquier grabación del mundo real puede capturar.

¿Por qué no precision=32? Los valores de precisión más altos aumentan el tiempo de CPU con rendimientos decrecientes. Con precision=28, SoXr ya opera 24 dB por debajo del suelo de ruido del audio a 24 bits — aumentar más sería inaudible e impráctico. Este es el punto óptimo utilizado por la mayoría de las herramientas de audio profesionales.

Cómo Usa CleverUtils SoXr

Cada conversión WAV en CleverUtils.com pasa por este proceso:

  1. Subida — tu archivo de audio se recibe por HTTPS
  2. Decodificación — FFmpeg lee el formato fuente (MP3, FLAC, M4A, OGG, etc.)
  3. Remuestreo — SoXr convierte a tu frecuencia de muestreo y profundidad de bits elegidas
  4. Dithering — el modelado de ruido Shibata se aplica durante la conversión de profundidad de bits
  5. Codificación — las muestras PCM limpias se escriben en el contenedor WAV
  6. Descarga — tu archivo WAV está listo

Todo el proceso es automático. Solo tienes que elegir los ajustes de destino (frecuencia de muestreo, profundidad de bits, canales) y CleverUtils se encarga del resto usando SoXr internamente. Sin configuración necesaria, sin interruptor de "modo calidad" — cada conversión recibe el mismo remuestreo de nivel estudio.

¿Listo para Convertir?

Convierte tu audio a WAV con remuestreo SoXr

Audio WAV

Toca para elegir tu archivo

o

Supports M4A, WAV, FLAC, OGG, AAC, WMA, AIFF, OPUS • Max 100 MB

Preguntas Frecuentes

SoXr (SoX Resampler Library) es un motor de remuestreo de calidad audiófila que utiliza algoritmos polifásicos basados en FFT con precisión de 28 bits. El swresample predeterminado de FFmpeg usa un filtro sinc con ventana Kaiser más sencillo que puede introducir aliasing medible cerca de la frecuencia de Nyquist. SoXr elimina estos artefactos por completo a la vez que utiliza dithering Shibata para un modelado de ruido optimizado psicoacústicamente.

El dithering Shibata es un método de modelado de ruido optimizado psicoacústicamente que desplaza el ruido de cuantización lejos del rango de 1–5 kHz donde el oído humano es más sensible (la curva de Fletcher-Munson). El resultado es un ruido de dither menos perceptible que el dithering triangular o rectangular estándar, aunque la energía total del ruido sea similar.

Para la mayoría de las escuchas casuales, la diferencia es inaudible. SoXr importa más al reducir audio hi-res (p. ej. de 96 kHz a 44,1 kHz), donde el aliasing de un remuestreador inferior podría volverse audible en equipos de monitorización de alta gama. También garantiza transparencia bit a bit para flujos de trabajo de masterización profesional donde los errores de procesamiento acumulados son relevantes.

No. SoXr se aplica automáticamente a cada conversión WAV en CleverUtils.com. Solo tienes que subir tu archivo, elegir los ajustes WAV (frecuencia de muestreo, profundidad de bits, canales) y el remuestreador SoXr se encarga del resto. No se necesita ningún interruptor ni configuración especial.

El remuestreo ocurre siempre que la frecuencia de muestreo objetivo difiere de la fuente — por ejemplo, al convertir un MP3 a 44,1 kHz a WAV a 48 kHz para vídeo, o al reducir un FLAC a 96 kHz a 44,1 kHz para grabar un CD. Incluso cuando las frecuencias de muestreo coinciden, el dithering Shibata de SoXr garantiza transiciones de profundidad de bits limpias (p. ej. float interno de 32 bits → salida de 16 bits).

Más guías de MP3 a WAV

Frecuencia de muestreo y profundidad de bits en WAV explicadas: qué ajustes usar
Entiende qué significan la frecuencia de muestreo, la profundidad de bits y los canales en los archivos WAV. Aprende ...
Cambio de Velocidad MP3 a WAV: Ajusta el Tempo para Edición
Cambia la velocidad de reproducción de archivos MP3 y conviértelos a WAV sin compresión. Ralentiza para transcripción...
MP3 a WAV con Graves: Salida sin Comprimir para Altavoces
Aplica refuerzo de graves a archivos MP3 y convierte a WAV sin comprimir. Sin recodificación con pérdida, los graves ...
MP3 a WAV con Aumento de Volumen: Amplifica Archivos MP3 Silenciosos para Edición
Aumenta el volumen de grabaciones MP3 silenciosas y conviértelas a WAV sin comprimir. Sin recodificación con pérdida:...
MP3 a WAV Fade In/Out: Salida Sin Compresión con Transiciones Suaves
Añade efectos de fade in y fade out a archivos MP3 y convíertelos a WAV sin compresión. Elige duraciones de 0,5s a 5s...
Normalizar Volumen de MP3 a WAV: Audio Consistente en Cada Pista
Los archivos MP3 de distintos álbumes, décadas y fuentes se masterizaron a niveles de volumen muy diferentes. Una pis...
¿Convirtir MP3 a WAV mejora la calidad? (El mito explicado)
"WAV tiene mayor calidad que MP3, así que convertir MP3 a WAV debería mejorar la calidad." Este es uno de los mitos m...
Volver al Conversor MP3 a WAV

Solicitar una función

0 / 2000