Lorenzob commited on
Commit
7854a2b
·
verified ·
1 Parent(s): 2504d76

Fix runtime error and update Gradio to the latest version

Browse files
Files changed (3) hide show
  1. README.md +1 -1
  2. app.py +4 -7
  3. requirements.txt +7 -7
README.md CHANGED
@@ -4,7 +4,7 @@ emoji: 🎙️
4
  colorFrom: pink
5
  colorTo: purple
6
  sdk: gradio
7
- sdk_version: 3.50.2
8
  app_file: app.py
9
  pinned: false
10
  ---
 
4
  colorFrom: pink
5
  colorTo: purple
6
  sdk: gradio
7
+ sdk_version: 4.12.0
8
  app_file: app.py
9
  pinned: false
10
  ---
app.py CHANGED
@@ -2,7 +2,7 @@
2
  import gradio as gr
3
  import torch
4
  import os
5
- from transformers import AutoProcessor, AutoModelForSpeechGeneration, set_seed
6
  import numpy as np
7
  from scipy import signal
8
  import warnings
@@ -27,7 +27,7 @@ def load_model_and_processor():
27
  try:
28
  print("📂 Caricamento del modello Aurora-1.6b-complete...")
29
  processor = AutoProcessor.from_pretrained(MODEL_REPO)
30
- model = AutoModelForSpeechGeneration.from_pretrained(
31
  MODEL_REPO,
32
  torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
33
  device_map="auto"
@@ -38,7 +38,7 @@ def load_model_and_processor():
38
  # Fallback al modello originale di Dia se il caricamento fallisce
39
  print("⚠️ Tentativo di fallback al modello Dia-1.6B...")
40
  processor = AutoProcessor.from_pretrained("nari-labs/Dia-1.6B")
41
- model = AutoModelForSpeechGeneration.from_pretrained(
42
  "nari-labs/Dia-1.6B",
43
  torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
44
  device_map="auto"
@@ -116,7 +116,7 @@ with gr.Blocks(title="Aurora-1.6b TTS Demo", theme=gr.themes.Soft()) as demo:
116
  gr.Markdown("""
117
  # 🎙️ Aurora-1.6b Text-to-Speech Demo
118
 
119
- Questa demo utilizza il modello **Aurora-1.6b-complete** per la sintesi vocale (TTS), un modello fine-tuned basato su Dia-1.6B con pesi completi.
120
 
121
  Il modello supporta italiano, inglese, spagnolo, francese e tedesco, ma è stato ottimizzato per l'italiano.
122
  """)
@@ -194,8 +194,5 @@ with gr.Blocks(title="Aurora-1.6b TTS Demo", theme=gr.themes.Soft()) as demo:
194
  outputs=[audio_output, error_output],
195
  )
196
 
197
- # Precarica il modello quando l'app viene avviata
198
- load_model_and_processor()
199
-
200
  # Avvia l'interfaccia
201
  demo.launch()
 
2
  import gradio as gr
3
  import torch
4
  import os
5
+ from transformers import AutoProcessor, SpeechT5ForTextToSpeech, set_seed
6
  import numpy as np
7
  from scipy import signal
8
  import warnings
 
27
  try:
28
  print("📂 Caricamento del modello Aurora-1.6b-complete...")
29
  processor = AutoProcessor.from_pretrained(MODEL_REPO)
30
+ model = SpeechT5ForTextToSpeech.from_pretrained(
31
  MODEL_REPO,
32
  torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
33
  device_map="auto"
 
38
  # Fallback al modello originale di Dia se il caricamento fallisce
39
  print("⚠️ Tentativo di fallback al modello Dia-1.6B...")
40
  processor = AutoProcessor.from_pretrained("nari-labs/Dia-1.6B")
41
+ model = SpeechT5ForTextToSpeech.from_pretrained(
42
  "nari-labs/Dia-1.6B",
43
  torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
44
  device_map="auto"
 
116
  gr.Markdown("""
117
  # 🎙️ Aurora-1.6b Text-to-Speech Demo
118
 
119
+ Questa demo utilizza il modello Aurora-1.6b-complete per la sintesi vocale (TTS), un modello fine-tuned basato su Dia-1.6B con pesi completi.
120
 
121
  Il modello supporta italiano, inglese, spagnolo, francese e tedesco, ma è stato ottimizzato per l'italiano.
122
  """)
 
194
  outputs=[audio_output, error_output],
195
  )
196
 
 
 
 
197
  # Avvia l'interfaccia
198
  demo.launch()
requirements.txt CHANGED
@@ -1,11 +1,11 @@
1
 
2
- transformers>=4.30.0
3
- torch>=1.13.0
4
- torchaudio>=0.13.0
5
- gradio>=3.50.0
6
- numpy>=1.19.0
7
  scipy>=1.10.0
8
  soundfile>=0.12.1
9
- accelerate>=0.20.0
10
  sentencepiece>=0.1.99
11
- safetensors>=0.3.1
 
1
 
2
+ transformers>=4.35.0
3
+ torch>=2.0.0
4
+ torchaudio>=2.0.0
5
+ gradio>=4.12.0
6
+ numpy>=1.23.0
7
  scipy>=1.10.0
8
  soundfile>=0.12.1
9
+ accelerate>=0.24.0
10
  sentencepiece>=0.1.99
11
+ safetensors>=0.4.0