Spaces:

musdfakoc
/

local_intelligence

Sleeping

musdfakoc commited on Sep 30, 2024

Commit

2efb66f

verified ·

1 Parent(s): fbb8eef

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -137,6 +137,7 @@ def magnitude_to_complex_spectrogram(magnitude_spectrogram):
     complex_spectrogram = torch.stack([magnitude_spectrogram, zero_phase], dim=-1)
     return complex_spectrogram
 def spectrogram_to_audio(magnitude_spectrogram):
     # Perform inverse log scaling
     magnitude_spectrogram = torch.expm1(magnitude_spectrogram)
@@ -150,7 +151,10 @@ def spectrogram_to_audio(magnitude_spectrogram):
     # Normalize audio to the range [-1, 1] (standard audio range)
     audio = audio / torch.max(torch.abs(audio))
-    # Convert audio to 16-bit integer format, as expected for WAV files
     audio = (audio * 32767).short()
     return audio

     complex_spectrogram = torch.stack([magnitude_spectrogram, zero_phase], dim=-1)
     return complex_spectrogram
 def spectrogram_to_audio(magnitude_spectrogram):
     # Perform inverse log scaling
     magnitude_spectrogram = torch.expm1(magnitude_spectrogram)
     # Normalize audio to the range [-1, 1] (standard audio range)
     audio = audio / torch.max(torch.abs(audio))
+    # Clip the audio to ensure it fits in the range [-1, 1]
+    audio = torch.clamp(audio, min=-1, max=1)
+    # Convert to 16-bit PCM format by scaling and casting
     audio = (audio * 32767).short()
     return audio