Spaces:

BorisovMaksim
/

denoising

Runtime error

App Files Files Community

BorisovMaksim commited on May 21, 2023

Commit

3b4a0f4

1 Parent(s): ba6efe9

update app

Browse files

Files changed (2) hide show

app.py +28 -26
denoisers/SpectralGating.py +4 -6

app.py CHANGED Viewed

@@ -10,6 +10,20 @@ import torchaudio
 import yaml
 def run_app(model_filename, config_filename):
     model_path = hf_hub_download(repo_id="BorisovMaksim/demucs", filename=model_filename)
@@ -20,37 +34,25 @@ def run_app(model_filename, config_filename):
     checkpoint = torch.load(model_path, map_location=torch.device('cpu'))
     model.load_state_dict(checkpoint['model_state_dict'])
-    def denoising_transform(audio):
-        # Path(__file__).parent.resolve()
-        src_path = Path("cache_wav/original/{}.wav".format(str(uuid.uuid4())))
-        tgt_path = Path("cache_wav/denoised/{}.wav".format(str(uuid.uuid4())))
-        src_path.parent.mkdir(exist_ok=True, parents=True)
-        tgt_path.parent.mkdir(exist_ok=True, parents=True)
-        (ffmpeg.input(audio)
-         .output(src_path.as_posix(), acodec='pcm_s16le', ac=1, ar=22050)
-         .run()
-         )
-        wav, rate = torchaudio.load(audio)
-        reduced_noise = model.predict(wav)
-        torchaudio.save(tgt_path, reduced_noise, rate)
-        return tgt_path
-    demo = gr.Interface(
-        fn=denoising_transform,
         inputs=gr.Audio(label="Source Audio", source="microphone", type='filepath'),
-        outputs=gr.Audio(label="Target Audio", type='filepath'),
-        examples=[
-            ["testing/wavs/p232_071.wav"],
-            ["testing/wavs/p232_284.wav"],
-        ],
-        title="Denoising"
     )
-    demo.launch()
 if __name__ == "__main__":
     model_filename = "original_sr/Demucs_original_sr_epoch3.pt"
     config_filename = "original_sr/config.yaml"
     run_app(model_filename, config_filename)

 import yaml
+def denoising_transform(audio, model):
+    src_path = Path("cache_wav/original/{}.wav".format(str(uuid.uuid4())))
+    tgt_path = Path("cache_wav/denoised/{}.wav".format(str(uuid.uuid4())))
+    src_path.parent.mkdir(exist_ok=True, parents=True)
+    tgt_path.parent.mkdir(exist_ok=True, parents=True)
+    (ffmpeg.input(audio)
+     .output(src_path.as_posix(), acodec='pcm_s16le', ac=1, ar=22050)
+     .run()
+     )
+    wav, rate = torchaudio.load(audio)
+    reduced_noise = model.predict(wav)
+    torchaudio.save(tgt_path, reduced_noise, rate)
+    return tgt_path
 def run_app(model_filename, config_filename):
     model_path = hf_hub_download(repo_id="BorisovMaksim/demucs", filename=model_filename)
     checkpoint = torch.load(model_path, map_location=torch.device('cpu'))
     model.load_state_dict(checkpoint['model_state_dict'])
+    interface_demucs = gr.Interface(
+        fn=lambda x: denoising_transform(x, model),
         inputs=gr.Audio(label="Source Audio", source="microphone", type='filepath'),
+        outputs=gr.Audio(label="Demucs", type='filepath')
     )
+    interface_spectral_gating = gr.Interface(
+        fn=lambda x: denoising_transform(x, SpectralGating()),
+        inputs=gr.Audio(label="Source Audio", source="microphone", type='filepath'),
+        outputs=gr.Audio(label="Spectral Gating", type='filepath')
+    )
+    gr.Parallel(interface_demucs, interface_spectral_gating,
+                title="Denoising",
+                examples=[
+                    ["testing/wavs/p232_071.wav"],
+                    ["testing/wavs/p232_284.wav"],
+                ]).launch()
 if __name__ == "__main__":
     model_filename = "original_sr/Demucs_original_sr_epoch3.pt"
     config_filename = "original_sr/config.yaml"
     run_app(model_filename, config_filename)

denoisers/SpectralGating.py CHANGED Viewed

@@ -4,7 +4,7 @@ import torchaudio
 class SpectralGating(torch.nn.Module):
-    def __init__(self, rate=16000):
         super(SpectralGating, self).__init__()
         self.rate = rate
@@ -12,11 +12,9 @@ class SpectralGating(torch.nn.Module):
         reduced_noise = torch.Tensor(nr.reduce_noise(y=wav, sr=self.rate))
         return reduced_noise
-    def predict(self, wav_path, out_path):
-        data, rate = torchaudio.load(wav_path)
-        reduced_noise = torch.Tensor(nr.reduce_noise(y=data, sr=rate))
-        torchaudio.save(out_path, reduced_noise, rate)
-        return out_path

 class SpectralGating(torch.nn.Module):
+    def __init__(self, rate=48000):
         super(SpectralGating, self).__init__()
         self.rate = rate
         reduced_noise = torch.Tensor(nr.reduce_noise(y=wav, sr=self.rate))
         return reduced_noise
+    def predict(self, wav):
+        reduced_noise = torch.Tensor(nr.reduce_noise(y=wav, sr=self.rate))
+        return reduced_noise