Spaces:

musdfakoc
/

local_intelligence

Sleeping

musdfakoc commited on Sep 29, 2024

Commit

153c20a

verified ·

1 Parent(s): 6f43676

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -179,6 +179,9 @@ def generate_audio_from_image(image):
     # Convert to the required format (e.g., float32)
     generated_audio = generated_audio.astype(np.float32)
     return generated_audio, sample_rate
@@ -193,10 +196,10 @@ def main():
     model_path = './gan_model.pth'  # Ensure the model is in the correct relative path
     generator = load_gan_model(generator, model_path, device)
-    # Gradio interface: allow users to upload an image and generate audio
     iface = gr.Interface(fn=generate_audio_from_image,
-                     inputs=gr.Image(type="pil"),  # PIL type image
-                     outputs=gr.Audio(type="numpy", label="Generated Audio"))
     iface.launch()

     # Convert to the required format (e.g., float32)
     generated_audio = generated_audio.astype(np.float32)
+    # Debug: Print the shape and type of the generated audio
+    print(f"Generated audio shape: {generated_audio.shape}, type: {generated_audio.dtype}")
     return generated_audio, sample_rate
     model_path = './gan_model.pth'  # Ensure the model is in the correct relative path
     generator = load_gan_model(generator, model_path, device)
     iface = gr.Interface(fn=generate_audio_from_image,
+                         inputs=gr.Image(type="pil"),
+                         outputs=gr.Audio(type="numpy", label="Generated Audio"))
     iface.launch()