RemFx

Sleeping

App Files Files Community

mattricesound commited on Apr 26, 2023

Commit

133e1dc

1 Parent(s): 7173f20

Add shuffling effect order, all effects present for chain_inference to cfg

Browse files

Files changed (6) hide show

cfg/exp/chain_inference.yaml +3 -1
cfg/exp/chain_inference_aug.yaml +3 -1
cfg/exp/chain_inference_aug_classifier.yaml +3 -1
cfg/exp/chain_inference_custom.yaml +3 -1
remfx/models.py +48 -27
scripts/chain_inference.py +2 -0

cfg/exp/chain_inference.yaml CHANGED Viewed

@@ -63,4 +63,6 @@ inference_effects_ordering:
   - "RandomPedalboardReverb"
   - "RandomPedalboardChorus"
   - "RandomPedalboardDelay"
-num_bins: 1025

   - "RandomPedalboardReverb"
   - "RandomPedalboardChorus"
   - "RandomPedalboardDelay"
+num_bins: 1025
+inference_effects_shuffle: False
+inference_use_all_effect_models: False

cfg/exp/chain_inference_aug.yaml CHANGED Viewed

@@ -63,4 +63,6 @@ inference_effects_ordering:
   - "RandomPedalboardReverb"
   - "RandomPedalboardChorus"
   - "RandomPedalboardDelay"
-num_bins: 1025

   - "RandomPedalboardReverb"
   - "RandomPedalboardChorus"
   - "RandomPedalboardDelay"
+num_bins: 1025
+inference_effects_shuffle: False
+inference_use_all_effect_models: False

cfg/exp/chain_inference_aug_classifier.yaml CHANGED Viewed

@@ -82,4 +82,6 @@ inference_effects_ordering:
   - "RandomPedalboardReverb"
   - "RandomPedalboardChorus"
   - "RandomPedalboardDelay"
-num_bins: 1025

   - "RandomPedalboardReverb"
   - "RandomPedalboardChorus"
   - "RandomPedalboardDelay"
+num_bins: 1025
+inference_effects_shuffle: False
+inference_use_all_effect_models: False

cfg/exp/chain_inference_custom.yaml CHANGED Viewed

@@ -68,4 +68,6 @@ inference_effects_ordering:
   - "RandomPedalboardReverb"
   - "RandomPedalboardChorus"
   - "RandomPedalboardDelay"
-num_bins: 1025

   - "RandomPedalboardReverb"
   - "RandomPedalboardChorus"
   - "RandomPedalboardDelay"
+num_bins: 1025
+inference_effects_shuffle: False
+inference_use_all_effect_models: False

remfx/models.py CHANGED Viewed

@@ -16,12 +16,22 @@ from remfx.callbacks import log_wandb_audio_batch
 from einops import rearrange
 from remfx import effects
 import asteroid
 ALL_EFFECTS = effects.Pedalboard_Effects
 class RemFXChainInference(pl.LightningModule):
-    def __init__(self, models, sample_rate, num_bins, effect_order, classifier=None):
         super().__init__()
         self.model = models
         self.mrstftloss = MultiResolutionSTFTLoss(
@@ -37,7 +47,9 @@ class RemFXChainInference(pl.LightningModule):
         self.sample_rate = sample_rate
         self.effect_order = effect_order
         self.classifier = classifier
         self.output_str = "IN_SISDR,OUT_SISDR,IN_STFT,OUT_STFT\n"
     def forward(self, batch, batch_idx, order=None):
         x, y, _, rem_fx_labels = batch
@@ -46,36 +58,45 @@ class RemFXChainInference(pl.LightningModule):
             effects_order = order
         else:
             effects_order = self.effect_order
-        old_labels = rem_fx_labels
         # Use classifier labels
         if self.classifier:
             threshold = 0.5
             with torch.no_grad():
                 labels = torch.sigmoid(self.classifier(x))
                 rem_fx_labels = torch.where(labels > threshold, 1.0, 0.0)
-        effects_present = [
-            [ALL_EFFECTS[i] for i, effect in enumerate(effect_label) if effect == 1.0]
-            for effect_label in rem_fx_labels
-        ]
         output = []
-        input_samples = rearrange(x, "b c t -> c (b t)").unsqueeze(0)
-        target_samples = rearrange(y, "b c t -> c (b t)").unsqueeze(0)
-        log_wandb_audio_batch(
-            logger=self.logger,
-            id="input_effected_audio",
-            samples=input_samples.cpu(),
-            sampling_rate=self.sample_rate,
-            caption="Input Data",
-        )
-        log_wandb_audio_batch(
-            logger=self.logger,
-            id="target_audio",
-            samples=target_samples.cpu(),
-            sampling_rate=self.sample_rate,
-            caption="Target Data",
-        )
         with torch.no_grad():
             for i, (elem, effects_list) in enumerate(zip(x, effects_present)):
                 elem = elem.unsqueeze(0)  # Add batch dim
@@ -111,7 +132,6 @@ class RemFXChainInference(pl.LightningModule):
                 # )
                 output.append(elem.squeeze(0))
         output = torch.stack(output)
-        output_samples = rearrange(output, "b c t -> c (b t)").unsqueeze(0)
         # log_wandb_audio_batch(
         #     logger=self.logger,
@@ -125,8 +145,9 @@ class RemFXChainInference(pl.LightningModule):
     def test_step(self, batch, batch_idx):
         x, y, _, _ = batch  # x, y = (B, C, T), (B, C, T)
-        # Random order
-        # random.shuffle(self.effect_order)
         loss, output = self.forward(batch, batch_idx, order=self.effect_order)
         # Crop target to match output
         if output.shape[-1] < y.shape[-1]:

 from einops import rearrange
 from remfx import effects
 import asteroid
+import random
 ALL_EFFECTS = effects.Pedalboard_Effects
 class RemFXChainInference(pl.LightningModule):
+    def __init__(
+        self,
+        models,
+        sample_rate,
+        num_bins,
+        effect_order,
+        classifier=None,
+        shuffle_effect_order=False,
+        use_all_effect_models=False,
+    ):
         super().__init__()
         self.model = models
         self.mrstftloss = MultiResolutionSTFTLoss(
         self.sample_rate = sample_rate
         self.effect_order = effect_order
         self.classifier = classifier
+        self.shuffle_effect_order = shuffle_effect_order
         self.output_str = "IN_SISDR,OUT_SISDR,IN_STFT,OUT_STFT\n"
+        self.use_all_effect_models = use_all_effect_models
     def forward(self, batch, batch_idx, order=None):
         x, y, _, rem_fx_labels = batch
             effects_order = order
         else:
             effects_order = self.effect_order
         # Use classifier labels
         if self.classifier:
             threshold = 0.5
             with torch.no_grad():
                 labels = torch.sigmoid(self.classifier(x))
                 rem_fx_labels = torch.where(labels > threshold, 1.0, 0.0)
+        if self.use_all_effect_models:
+            effects_present = [
+                [ALL_EFFECTS[i] for i, effect in enumerate(effect_label) if effect]
+                for effect_label in rem_fx_labels
+            ]
+        else:
+            effects_present = [
+                [
+                    ALL_EFFECTS[i]
+                    for i, effect in enumerate(effect_label)
+                    if effect == 1.0
+                ]
+                for effect_label in rem_fx_labels
+            ]
         output = []
+        # input_samples = rearrange(x, "b c t -> c (b t)").unsqueeze(0)
+        # target_samples = rearrange(y, "b c t -> c (b t)").unsqueeze(0)
+        # log_wandb_audio_batch(
+        #     logger=self.logger,
+        #     id="input_effected_audio",
+        #     samples=input_samples.cpu(),
+        #     sampling_rate=self.sample_rate,
+        #     caption="Input Data",
+        # )
+        # log_wandb_audio_batch(
+        #     logger=self.logger,
+        #     id="target_audio",
+        #     samples=target_samples.cpu(),
+        #     sampling_rate=self.sample_rate,
+        #     caption="Target Data",
+        # )
         with torch.no_grad():
             for i, (elem, effects_list) in enumerate(zip(x, effects_present)):
                 elem = elem.unsqueeze(0)  # Add batch dim
                 # )
                 output.append(elem.squeeze(0))
         output = torch.stack(output)
         # log_wandb_audio_batch(
         #     logger=self.logger,
     def test_step(self, batch, batch_idx):
         x, y, _, _ = batch  # x, y = (B, C, T), (B, C, T)
+        if self.shuffle_effect_order:
+            # Random order
+            random.shuffle(self.effect_order)
         loss, output = self.forward(batch, batch_idx, order=self.effect_order)
         # Crop target to match output
         if output.shape[-1] < y.shape[-1]:

scripts/chain_inference.py CHANGED Viewed

@@ -65,6 +65,8 @@ def main(cfg: DictConfig):
         num_bins=cfg.num_bins,
         effect_order=cfg.inference_effects_ordering,
         classifier=classifier,
     )
     trainer.test(model=inference_model, datamodule=datamodule)

         num_bins=cfg.num_bins,
         effect_order=cfg.inference_effects_ordering,
         classifier=classifier,
+        shuffle_effect_order=cfg.inference_effects_shuffle,
+        use_all_effect_models=cfg.inference_use_all_effect_models,
     )
     trainer.test(model=inference_model, datamodule=datamodule)