Spaces:

Lorenzob
/

aurora-1.6b

Runtime error

App Files Files Community

Lorenzob commited on May 9

Commit

ed5e263

verified ·

1 Parent(s): f1cf03f

Soluzione specifica per Aurora-1.6b-complete con caricamento manuale

Browse files

Files changed (1) hide show

app.py +5 -66

app.py CHANGED Viewed

@@ -20,17 +20,12 @@ torch.manual_seed(42)
 MODEL_REPO = "Lorenzob/aurora-1.6b-complete"  # Repository del modello
 CACHE_DIR = "./model_cache"  # Directory per la cache del modello
 SAMPLE_RATE = 24000  # Frequenza di campionamento
-AUDIO_DIR = "./audio_cache"  # Directory per salvare gli audio generati
 # Cache per componenti del modello
 processor = None
 model = None
 speaker_embeddings_cache = {}
-# Assicurati che le directory esistano
-os.makedirs(CACHE_DIR, exist_ok=True)
-os.makedirs(AUDIO_DIR, exist_ok=True)
 def download_file(url, save_path):
     """Scarica un file da un URL"""
     response = requests.get(url, stream=True)
@@ -80,6 +75,9 @@ def fix_aurora_config():
     config_url = f"https://huggingface.co/{MODEL_REPO}/resolve/main/config.json"
     local_config_path = os.path.join(CACHE_DIR, "config.json")
     try:
         # Scarica il file di configurazione
         print(f"Scaricamento della configurazione da {config_url}...")
@@ -189,24 +187,6 @@ def load_aurora_model_manually():
         return model, processor
-def save_audio_to_file(audio_array, sample_rate):
-    """Salva l'audio in un file e restituisce il percorso"""
-    try:
-        import soundfile as sf
-        import time
-        # Crea un nome univoco per il file
-        timestamp = int(time.time())
-        audio_path = os.path.join(AUDIO_DIR, f"audio_{timestamp}.wav")
-        # Salva l'audio come file WAV
-        sf.write(audio_path, audio_array, sample_rate)
-        return audio_path
-    except Exception as e:
-        print(f"Errore nel salvare l'audio: {e}")
-        return None
 def text_to_speech(text, language="it", speaker_id=0, speed=1.0, show_log=True):
     """Converte testo in voce utilizzando Aurora-1.6b-complete"""
     if not text.strip():
@@ -291,12 +271,6 @@ def text_to_speech(text, language="it", speaker_id=0, speed=1.0, show_log=True):
         if show_log:
             print(f"✅ Audio generato con successo! Lunghezza: {len(speech_array)} campioni")
-        # Salva l'audio in un file per evitare problemi di perdita
-        audio_path = save_audio_to_file(speech_array, sample_rate)
-        if audio_path and show_log:
-            print(f"Audio salvato in {audio_path}")
-        # Restituisci l'audio come tupla (sample_rate, speech_array)
         return (sample_rate, speech_array), None
     except Exception as e:
         error_msg = f"Errore nella generazione dell'audio: {str(e)}"
@@ -305,31 +279,6 @@ def text_to_speech(text, language="it", speaker_id=0, speed=1.0, show_log=True):
         print(f"❌ {detailed_error}")
         return None, detailed_error
-# Funzione di cleanup per rimuovere file vecchi
-def cleanup_old_audio_files():
-    """Rimuove i file audio vecchi per risparmiare spazio"""
-    try:
-        import time
-        import glob
-        # Trova tutti i file audio
-        audio_files = glob.glob(os.path.join(AUDIO_DIR, "*.wav"))
-        # Ottieni il tempo attuale
-        current_time = time.time()
-        # Rimuovi i file più vecchi di 1 ora
-        for file in audio_files:
-            file_time = os.path.getmtime(file)
-            if current_time - file_time > 3600:  # 3600 secondi = 1 ora
-                os.remove(file)
-                print(f"Rimosso file audio vecchio: {file}")
-    except Exception as e:
-        print(f"Errore nel cleanup dei file audio: {e}")
-# Esegui il cleanup all'avvio
-cleanup_old_audio_files()
 # Esempi predefiniti per l'interfaccia
 examples = [
     ["Ciao, mi chiamo Aurora e sono un assistente vocale italiano.", "it", 0, 1.0, True],
@@ -342,9 +291,6 @@ examples = [
 # Definizione dell'interfaccia Gradio
 with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as demo:
-    # Stato nascosto per memorizzare l'ultimo audio generato
-    audio_state = gr.State(value=None)
     gr.Markdown("""
     # 🎙️ Aurora-1.6b-complete Text-to-Speech Demo
@@ -391,12 +337,7 @@ with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as
             submit_btn = gr.Button("Genera Audio", variant="primary")
         with gr.Column(scale=1):
-            audio_output = gr.Audio(
-                label="Audio generato",
-                type="numpy",  # Usa il tipo numpy per evitare problemi
-                show_share_button=True,
-                autoplay=True
-            )
             error_output = gr.Textbox(label="Messaggi di errore", visible=True, lines=6)
     # Esempi
@@ -416,7 +357,6 @@ with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as
     - Puoi cambiare lo Speaker ID per ottenere voci con caratteristiche diverse
     - La velocità di generazione dipende dalle risorse disponibili sul server
     - Il checkbox "Mostra log di debug" è utile per diagnosticare eventuali problemi
-    - **Gli audio generati vengono salvati automaticamente sul server** per evitare di perderli
     ## 🔗 Crediti
@@ -430,7 +370,6 @@ with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as
         fn=text_to_speech,
         inputs=[text_input, language_input, speaker_input, speed_input, debug_input],
         outputs=[audio_output, error_output],
-        api_name=None  # Disabilita l'API endpoint per questa funzione
     )
 # Precarica il modello all'avvio
@@ -441,4 +380,4 @@ except Exception as e:
     print(f"Errore nell'inizializzazione: {e}")
 # Avvia l'interfaccia
-demo.launch(share=False, show_error=True, prevent_thread_lock=True)

 MODEL_REPO = "Lorenzob/aurora-1.6b-complete"  # Repository del modello
 CACHE_DIR = "./model_cache"  # Directory per la cache del modello
 SAMPLE_RATE = 24000  # Frequenza di campionamento
 # Cache per componenti del modello
 processor = None
 model = None
 speaker_embeddings_cache = {}
 def download_file(url, save_path):
     """Scarica un file da un URL"""
     response = requests.get(url, stream=True)
     config_url = f"https://huggingface.co/{MODEL_REPO}/resolve/main/config.json"
     local_config_path = os.path.join(CACHE_DIR, "config.json")
+    # Crea la directory cache se non esiste
+    os.makedirs(CACHE_DIR, exist_ok=True)
     try:
         # Scarica il file di configurazione
         print(f"Scaricamento della configurazione da {config_url}...")
         return model, processor
 def text_to_speech(text, language="it", speaker_id=0, speed=1.0, show_log=True):
     """Converte testo in voce utilizzando Aurora-1.6b-complete"""
     if not text.strip():
         if show_log:
             print(f"✅ Audio generato con successo! Lunghezza: {len(speech_array)} campioni")
         return (sample_rate, speech_array), None
     except Exception as e:
         error_msg = f"Errore nella generazione dell'audio: {str(e)}"
         print(f"❌ {detailed_error}")
         return None, detailed_error
 # Esempi predefiniti per l'interfaccia
 examples = [
     ["Ciao, mi chiamo Aurora e sono un assistente vocale italiano.", "it", 0, 1.0, True],
 # Definizione dell'interfaccia Gradio
 with gr.Blocks(title="Aurora-1.6b-complete TTS Demo", theme=gr.themes.Soft()) as demo:
     gr.Markdown("""
     # 🎙️ Aurora-1.6b-complete Text-to-Speech Demo
             submit_btn = gr.Button("Genera Audio", variant="primary")
         with gr.Column(scale=1):
+            audio_output = gr.Audio(label="Audio generato", show_share_button=True)
             error_output = gr.Textbox(label="Messaggi di errore", visible=True, lines=6)
     # Esempi
     - Puoi cambiare lo Speaker ID per ottenere voci con caratteristiche diverse
     - La velocità di generazione dipende dalle risorse disponibili sul server
     - Il checkbox "Mostra log di debug" è utile per diagnosticare eventuali problemi
     ## 🔗 Crediti
         fn=text_to_speech,
         inputs=[text_input, language_input, speaker_input, speed_input, debug_input],
         outputs=[audio_output, error_output],
     )
 # Precarica il modello all'avvio
     print(f"Errore nell'inizializzazione: {e}")
 # Avvia l'interfaccia
+demo.launch()