Spaces:

Lorenzob
/

aurora-1.6b

Runtime error

App Files Files Community

Lorenzob commited on May 9

Commit

f1cf03f

verified ·

1 Parent(s): 42b3672

Soluzione finale per Aurora con persistenza dell'audio

Browse files

Files changed (1) hide show

app.py +66 -5

app.py CHANGED Viewed

@@ -20,12 +20,17 @@ torch.manual_seed(42)
 MODEL_REPO = "Lorenzob/aurora-1.6b-complete"  # Repository del modello
 CACHE_DIR = "./model_cache"  # Directory per la cache del modello
 SAMPLE_RATE = 24000  # Frequenza di campionamento
 # Cache per componenti del modello
 processor = None
 model = None
 speaker_embeddings_cache = {}
 def download_file(url, save_path):
     """Scarica un file da un URL"""
     response = requests.get(url, stream=True)
@@ -75,9 +80,6 @@ def fix_aurora_config():
     config_url = f"https://huggingface.co/{MODEL_REPO}/resolve/main/config.json"
     local_config_path = os.path.join(CACHE_DIR, "config.json")
-    # Crea la directory cache se non esiste
-    os.makedirs(CACHE_DIR, exist_ok=True)
     try:
         # Scarica il file di configurazione
         print(f"Scaricamento della configurazione da {config_url}...")
@@ -187,6 +189,24 @@ def load_aurora_model_manually():
         return model, processor
 def text_to_speech(text, language="it", speaker_id=0, speed=1.0, show_log=True):
     """Converte testo in voce utilizzando Aurora-1.6b-complete"""
     if not text.strip():
@@ -271,6 +291,12 @@ def text_to_speech(text, language="it", speaker_id=0, speed=1.0, show_log=True):
         if show_log:
             print(f"✅ Audio generato con successo! Lunghezza: {len(speech_array)} campioni")
         return (sample_rate, speech_array), None
     except Exception as e:
         error_msg = f"Errore nella generazione dell'audio: {str(e)}"
@@ -279,6 +305,31 @@ def text_to_speech(text, language="it", speaker_id=0, speed=1.0, show_log=True):
         print(f"❌ {detailed_error}")
         return None, detailed_error
 # Esempi predefiniti per l'interfaccia
 examples = [
     ["Ciao, mi chiamo Aurora e sono un assistente vocale italiano.", "it", 0, 1.0, True],
@@ -291,6 +342,9 @@ examples = [
 # Definizione dell'interfaccia Gradio
 with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as demo:
     gr.Markdown("""
     # 🎙️ Aurora-1.6b-complete Text-to-Speech Demo
@@ -337,7 +391,12 @@ with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as
             submit_btn = gr.Button("Genera Audio", variant="primary")
         with gr.Column(scale=1):
-            audio_output = gr.Audio(label="Audio generato", show_share_button=True)
             error_output = gr.Textbox(label="Messaggi di errore", visible=True, lines=6)
     # Esempi
@@ -357,6 +416,7 @@ with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as
     - Puoi cambiare lo Speaker ID per ottenere voci con caratteristiche diverse
     - La velocità di generazione dipende dalle risorse disponibili sul server
     - Il checkbox "Mostra log di debug" è utile per diagnosticare eventuali problemi
     ## 🔗 Crediti
@@ -370,6 +430,7 @@ with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as
         fn=text_to_speech,
         inputs=[text_input, language_input, speaker_input, speed_input, debug_input],
         outputs=[audio_output, error_output],
     )
 # Precarica il modello all'avvio
@@ -380,4 +441,4 @@ except Exception as e:
     print(f"Errore nell'inizializzazione: {e}")
 # Avvia l'interfaccia
-demo.launch()

 MODEL_REPO = "Lorenzob/aurora-1.6b-complete"  # Repository del modello
 CACHE_DIR = "./model_cache"  # Directory per la cache del modello
 SAMPLE_RATE = 24000  # Frequenza di campionamento
+AUDIO_DIR = "./audio_cache"  # Directory per salvare gli audio generati
 # Cache per componenti del modello
 processor = None
 model = None
 speaker_embeddings_cache = {}
+# Assicurati che le directory esistano
+os.makedirs(CACHE_DIR, exist_ok=True)
+os.makedirs(AUDIO_DIR, exist_ok=True)
 def download_file(url, save_path):
     """Scarica un file da un URL"""
     response = requests.get(url, stream=True)
     config_url = f"https://huggingface.co/{MODEL_REPO}/resolve/main/config.json"
     local_config_path = os.path.join(CACHE_DIR, "config.json")
     try:
         # Scarica il file di configurazione
         print(f"Scaricamento della configurazione da {config_url}...")
         return model, processor
+def save_audio_to_file(audio_array, sample_rate):
+    """Salva l'audio in un file e restituisce il percorso"""
+    try:
+        import soundfile as sf
+        import time
+        # Crea un nome univoco per il file
+        timestamp = int(time.time())
+        audio_path = os.path.join(AUDIO_DIR, f"audio_{timestamp}.wav")
+        # Salva l'audio come file WAV
+        sf.write(audio_path, audio_array, sample_rate)
+        return audio_path
+    except Exception as e:
+        print(f"Errore nel salvare l'audio: {e}")
+        return None
 def text_to_speech(text, language="it", speaker_id=0, speed=1.0, show_log=True):
     """Converte testo in voce utilizzando Aurora-1.6b-complete"""
     if not text.strip():
         if show_log:
             print(f"✅ Audio generato con successo! Lunghezza: {len(speech_array)} campioni")
+        # Salva l'audio in un file per evitare problemi di perdita
+        audio_path = save_audio_to_file(speech_array, sample_rate)
+        if audio_path and show_log:
+            print(f"Audio salvato in {audio_path}")
+        # Restituisci l'audio come tupla (sample_rate, speech_array)
         return (sample_rate, speech_array), None
     except Exception as e:
         error_msg = f"Errore nella generazione dell'audio: {str(e)}"
         print(f"❌ {detailed_error}")
         return None, detailed_error
+# Funzione di cleanup per rimuovere file vecchi
+def cleanup_old_audio_files():
+    """Rimuove i file audio vecchi per risparmiare spazio"""
+    try:
+        import time
+        import glob
+        # Trova tutti i file audio
+        audio_files = glob.glob(os.path.join(AUDIO_DIR, "*.wav"))
+        # Ottieni il tempo attuale
+        current_time = time.time()
+        # Rimuovi i file più vecchi di 1 ora
+        for file in audio_files:
+            file_time = os.path.getmtime(file)
+            if current_time - file_time > 3600:  # 3600 secondi = 1 ora
+                os.remove(file)
+                print(f"Rimosso file audio vecchio: {file}")
+    except Exception as e:
+        print(f"Errore nel cleanup dei file audio: {e}")
+# Esegui il cleanup all'avvio
+cleanup_old_audio_files()
 # Esempi predefiniti per l'interfaccia
 examples = [
     ["Ciao, mi chiamo Aurora e sono un assistente vocale italiano.", "it", 0, 1.0, True],
 # Definizione dell'interfaccia Gradio
 with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as demo:
+    # Stato nascosto per memorizzare l'ultimo audio generato
+    audio_state = gr.State(value=None)
     gr.Markdown("""
     # 🎙️ Aurora-1.6b-complete Text-to-Speech Demo
             submit_btn = gr.Button("Genera Audio", variant="primary")
         with gr.Column(scale=1):
+            audio_output = gr.Audio(
+                label="Audio generato",
+                type="numpy",  # Usa il tipo numpy per evitare problemi
+                show_share_button=True,
+                autoplay=True
+            )
             error_output = gr.Textbox(label="Messaggi di errore", visible=True, lines=6)
     # Esempi
     - Puoi cambiare lo Speaker ID per ottenere voci con caratteristiche diverse
     - La velocità di generazione dipende dalle risorse disponibili sul server
     - Il checkbox "Mostra log di debug" è utile per diagnosticare eventuali problemi
+    - **Gli audio generati vengono salvati automaticamente sul server** per evitare di perderli
     ## 🔗 Crediti
         fn=text_to_speech,
         inputs=[text_input, language_input, speaker_input, speed_input, debug_input],
         outputs=[audio_output, error_output],
+        api_name=None  # Disabilita l'API endpoint per questa funzione
     )
 # Precarica il modello all'avvio
     print(f"Errore nell'inizializzazione: {e}")
 # Avvia l'interfaccia
+demo.launch(share=False, show_error=True, prevent_thread_lock=True)