RVC_PlayGround2

Sleeping

App Files Files Community

Rejekts commited on Sep 27, 2024

Commit

790d00b

verified ·

1 Parent(s): f1108f5

Update app.py

Browse files

Files changed (1) hide show

app.py +31 -4

app.py CHANGED Viewed

@@ -9,10 +9,32 @@ os.environ['weight_root']="assets/weights"
 from infer.modules.vc.modules import VC
 from configs.config import Config
 import torch
 os.makedirs(os.path.join(".", "audios"), exist_ok=True)
 config = Config()
 vc = VC(config)
 def warn(text):
     try: gr.Warning(text)
     except: pass
@@ -289,9 +311,14 @@ with gr.Blocks() as app:
         audio_refresher.click(fn=refresh,inputs=[],outputs=[audio_picker,model_picker,index_picker])
         convert_button = gr.Button("Convert")
     with gr.Row():
-        audio_player = gr.Audio()
-        inputs = [audio_picker,model_picker,index_picker,index_rate,pitch,method]
-        audio_picker.change(fn=update_audio_player, inputs=[audio_picker],outputs=[audio_player])
-        convert_button.click(convert, inputs=inputs,outputs=[audio_picker,audio_player])
 app.queue(max_size=20).launch(debug=True,allowed_paths=["kofi_button.png"])

 from infer.modules.vc.modules import VC
 from configs.config import Config
 import torch
+from pydub import AudioSegment
+import numpy as np
 os.makedirs(os.path.join(".", "audios"), exist_ok=True)
 config = Config()
 vc = VC(config)
+def stereo(audio_path, delay_ms=0.6):
+    sample_rate, audio_array = audio_path
+    if len(audio_array.shape) == 1:
+        audio_bytes = audio_array.tobytes()
+        mono_audio = AudioSegment(
+            data=audio_bytes,
+            sample_width=audio_array.dtype.itemsize,  # 2 bytes for int16
+            frame_rate=sample_rate,  # Use the sample rate from your tuple
+            channels=1  # Adjust if your audio has more channels
+            )
+        samples = np.array(mono_audio.get_array_of_samples())
+        delay_samples = int(mono_audio.frame_rate * (delay_ms / 1000.0))
+        left_channel = np.zeros_like(samples)
+        right_channel = samples
+        left_channel[delay_samples:] = samples[:-delay_samples] #Offset to the left
+        stereo_samples = np.column_stack((left_channel, right_channel))
+        return (sample_rate, stereo_samples.astype(np.int16))
+    else:
+        return audio_path
 def warn(text):
     try: gr.Warning(text)
     except: pass
         audio_refresher.click(fn=refresh,inputs=[],outputs=[audio_picker,model_picker,index_picker])
         convert_button = gr.Button("Convert")
     with gr.Row():
+        with gr.Tabs():
+            with gr.TabItem("Original"):
+                audio_player = gr.Audio()
+                inputs = [audio_picker,model_picker,index_picker,index_rate,pitch,method]
+                audio_picker.change(fn=update_audio_player, inputs=[audio_picker],outputs=[audio_player])
+                convert_button.click(convert, inputs=inputs,outputs=[audio_picker,audio_player])
+            with gr.TabItem("Stereo"):
+                stereo_player = gr.Audio()
+                audio_player.change(fn=stereo, inputs=[audio_player],outputs=[stereo_player])
 app.queue(max_size=20).launch(debug=True,allowed_paths=["kofi_button.png"])