RemFx

Sleeping

App Files Files Community

mattricesound commited on Jan 26, 2023

Commit

ff526b3

1 Parent(s): 1530829

Add metrics

Browse files

Files changed (1) hide show

remfx/models.py +33 -21

remfx/models.py CHANGED Viewed

@@ -4,7 +4,9 @@ import pytorch_lightning as pl
 from einops import rearrange
 import wandb
 from audio_diffusion_pytorch import DiffusionModel
-import auraloss
 from umx.openunmix.model import OpenUnmix, Separator
@@ -28,6 +30,13 @@ class RemFXModel(pl.LightningModule):
         self.lr_weight_decay = lr_weight_decay
         self.sample_rate = sample_rate
         self.model = network
     @property
     def device(self):
@@ -49,10 +58,23 @@ class RemFXModel(pl.LightningModule):
     def validation_step(self, batch, batch_idx):
         loss = self.common_step(batch, batch_idx, mode="valid")
     def common_step(self, batch, batch_idx, mode: str = "train"):
-        loss = self.model(batch)
         self.log(f"{mode}_loss", loss)
         return loss
     def on_validation_epoch_start(self):
@@ -62,24 +84,13 @@ class RemFXModel(pl.LightningModule):
         if self.log_next:
             x, target, label = batch
             y = self.model.sample(x)
             log_wandb_audio_batch(
                 logger=self.logger,
-                id="sample",
-                samples=x.cpu(),
-                sampling_rate=self.sample_rate,
-                caption=f"Epoch {self.current_epoch}",
-            )
-            log_wandb_audio_batch(
-                logger=self.logger,
-                id="prediction",
-                samples=y.cpu(),
-                sampling_rate=self.sample_rate,
-                caption=f"Epoch {self.current_epoch}",
-            )
-            log_wandb_audio_batch(
-                logger=self.logger,
-                id="target",
-                samples=target.cpu(),
                 sampling_rate=self.sample_rate,
                 caption=f"Epoch {self.current_epoch}",
             )
@@ -116,7 +127,7 @@ class OpenUnmixModel(torch.nn.Module):
             n_fft=self.n_fft,
             n_hop=self.hop_length,
         )
-        self.loss_fn = auraloss.freq.MultiResolutionSTFTLoss(
             n_bins=self.num_bins, sample_rate=self.sample_rate
         )
@@ -127,7 +138,7 @@ class OpenUnmixModel(torch.nn.Module):
         sep_out = self.separator(x).squeeze(1)
         loss = self.loss_fn(sep_out, target)
-        return loss
     def sample(self, x: Tensor) -> Tensor:
         return self.separator(x).squeeze(1)
@@ -140,7 +151,8 @@ class DiffusionGenerationModel(nn.Module):
     def forward(self, batch):
         x, target, label = batch
-        return self.model(x)
     def sample(self, x: Tensor, num_steps: int = 10) -> Tensor:
         noise = torch.randn(x.shape).to(x)

 from einops import rearrange
 import wandb
 from audio_diffusion_pytorch import DiffusionModel
+from auraloss.time import SISDRLoss
+from auraloss.freq import MultiResolutionSTFTLoss, STFTLoss
+from torch.nn import L1Loss
 from umx.openunmix.model import OpenUnmix, Separator
         self.lr_weight_decay = lr_weight_decay
         self.sample_rate = sample_rate
         self.model = network
+        self.metrics = torch.nn.ModuleDict(
+            {
+                "SISDR": SISDRLoss(),
+                "STFT": STFTLoss(),
+                "L1": L1Loss(),
+            }
+        )
     @property
     def device(self):
     def validation_step(self, batch, batch_idx):
         loss = self.common_step(batch, batch_idx, mode="valid")
+        return loss
     def common_step(self, batch, batch_idx, mode: str = "train"):
+        loss, output = self.model(batch)
         self.log(f"{mode}_loss", loss)
+        x, y, label = batch
+        # Metric logging
+        for metric in self.metrics:
+            self.log(
+                f"{mode}_{metric}",
+                self.metrics[metric](output, y),
+                on_step=False,
+                on_epoch=True,
+                logger=True,
+                prog_bar=True,
+            )
         return loss
     def on_validation_epoch_start(self):
         if self.log_next:
             x, target, label = batch
             y = self.model.sample(x)
+            # Concat samples together for easier viewing in dashboard
+            concat_samples = torch.cat([x, y, target], dim=-1)
             log_wandb_audio_batch(
                 logger=self.logger,
+                id="prediction_sample_target",
+                samples=concat_samples.cpu(),
                 sampling_rate=self.sample_rate,
                 caption=f"Epoch {self.current_epoch}",
             )
             n_fft=self.n_fft,
             n_hop=self.hop_length,
         )
+        self.loss_fn = MultiResolutionSTFTLoss(
             n_bins=self.num_bins, sample_rate=self.sample_rate
         )
         sep_out = self.separator(x).squeeze(1)
         loss = self.loss_fn(sep_out, target)
+        return loss, sep_out
     def sample(self, x: Tensor) -> Tensor:
         return self.separator(x).squeeze(1)
     def forward(self, batch):
         x, target, label = batch
+        sampled_out = self.model.sample(x)
+        return self.model(x), sampled_out
     def sample(self, x: Tensor, num_steps: int = 10) -> Tensor:
         noise = torch.randn(x.shape).to(x)