Spaces:

Lorenzob
/

aurora-1.6b

Runtime error

App Files Files Community

Lorenzob commited on May 9

Commit

7854a2b

verified ·

1 Parent(s): 2504d76

Fix runtime error and update Gradio to the latest version

Browse files

Files changed (3) hide show

README.md +1 -1
app.py +4 -7
requirements.txt +7 -7

README.md CHANGED Viewed

@@ -4,7 +4,7 @@ emoji: 🎙️
 colorFrom: pink
 colorTo: purple
 sdk: gradio
-sdk_version: 3.50.2
 app_file: app.py
 pinned: false
 ---

 colorFrom: pink
 colorTo: purple
 sdk: gradio
+sdk_version: 4.12.0
 app_file: app.py
 pinned: false
 ---

app.py CHANGED Viewed

@@ -2,7 +2,7 @@
 import gradio as gr
 import torch
 import os
-from transformers import AutoProcessor, AutoModelForSpeechGeneration, set_seed
 import numpy as np
 from scipy import signal
 import warnings
@@ -27,7 +27,7 @@ def load_model_and_processor():
         try:
             print("📂 Caricamento del modello Aurora-1.6b-complete...")
             processor = AutoProcessor.from_pretrained(MODEL_REPO)
-            model = AutoModelForSpeechGeneration.from_pretrained(
                 MODEL_REPO,
                 torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
                 device_map="auto"
@@ -38,7 +38,7 @@ def load_model_and_processor():
             # Fallback al modello originale di Dia se il caricamento fallisce
             print("⚠️ Tentativo di fallback al modello Dia-1.6B...")
             processor = AutoProcessor.from_pretrained("nari-labs/Dia-1.6B")
-            model = AutoModelForSpeechGeneration.from_pretrained(
                 "nari-labs/Dia-1.6B",
                 torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
                 device_map="auto"
@@ -116,7 +116,7 @@ with gr.Blocks(title="Aurora-1.6b TTS Demo", theme=gr.themes.Soft()) as demo:
     gr.Markdown("""
     # 🎙️ Aurora-1.6b Text-to-Speech Demo
-    Questa demo utilizza il modello **Aurora-1.6b-complete** per la sintesi vocale (TTS), un modello fine-tuned basato su Dia-1.6B con pesi completi.
     Il modello supporta italiano, inglese, spagnolo, francese e tedesco, ma è stato ottimizzato per l'italiano.
     """)
@@ -194,8 +194,5 @@ with gr.Blocks(title="Aurora-1.6b TTS Demo", theme=gr.themes.Soft()) as demo:
         outputs=[audio_output, error_output],
     )
-# Precarica il modello quando l'app viene avviata
-load_model_and_processor()
 # Avvia l'interfaccia
 demo.launch()

 import gradio as gr
 import torch
 import os
+from transformers import AutoProcessor, SpeechT5ForTextToSpeech, set_seed
 import numpy as np
 from scipy import signal
 import warnings
         try:
             print("📂 Caricamento del modello Aurora-1.6b-complete...")
             processor = AutoProcessor.from_pretrained(MODEL_REPO)
+            model = SpeechT5ForTextToSpeech.from_pretrained(
                 MODEL_REPO,
                 torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
                 device_map="auto"
             # Fallback al modello originale di Dia se il caricamento fallisce
             print("⚠️ Tentativo di fallback al modello Dia-1.6B...")
             processor = AutoProcessor.from_pretrained("nari-labs/Dia-1.6B")
+            model = SpeechT5ForTextToSpeech.from_pretrained(
                 "nari-labs/Dia-1.6B",
                 torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
                 device_map="auto"
     gr.Markdown("""
     # 🎙️ Aurora-1.6b Text-to-Speech Demo
+    Questa demo utilizza il modello Aurora-1.6b-complete per la sintesi vocale (TTS), un modello fine-tuned basato su Dia-1.6B con pesi completi.
     Il modello supporta italiano, inglese, spagnolo, francese e tedesco, ma è stato ottimizzato per l'italiano.
     """)
         outputs=[audio_output, error_output],
     )
 # Avvia l'interfaccia
 demo.launch()

requirements.txt CHANGED Viewed

@@ -1,11 +1,11 @@
-transformers>=4.30.0
-torch>=1.13.0
-torchaudio>=0.13.0
-gradio>=3.50.0
-numpy>=1.19.0
 scipy>=1.10.0
 soundfile>=0.12.1
-accelerate>=0.20.0
 sentencepiece>=0.1.99
-safetensors>=0.3.1

+transformers>=4.35.0
+torch>=2.0.0
+torchaudio>=2.0.0
+gradio>=4.12.0
+numpy>=1.23.0
 scipy>=1.10.0
 soundfile>=0.12.1
+accelerate>=0.24.0
 sentencepiece>=0.1.99
+safetensors>=0.4.0