Este articulo describe un modelo de ocultamiento de voz (mensaje secreto) en audio (senal huesped) basado en la tecnica de espectro desplazado, Shift Spectrum Algorithm (SSA), y la Transformada Wavelet Discreta (DWT). Las senales de voz y audio se descomponen utilizando la DWT multinivel. Los coeficientes del mensaje secreto se ocultan en los coeficientes de detalle de la senal huesped, utilizando un reordenamiento de sub-bandas basado en un criterio de similitud. La clave secreta contiene la informacion del reordenamiento de las sub-bandas del mensaje secreto. La reconstruccion de los coeficientes wavelet superpuestos de las dos senales corresponde a la senal estego, la cual tiene la misma escala de tiempo y rango dinamico de la senal huesped. La calidad de la senal estego se califica con la prueba de promedio de opinion, Mean Opinion Score (MOS) del estandar ITU-T P.835.