mhenrhcsen commited on
Commit
e13466b
·
1 Parent(s): 0f81137

Update app.py to change the model name to "syvai/tts-v0.3-finetuned", add a new example for the voice "sofie", and update the Gradio interface title and description to reflect the new version and additional voice capabilities.

Browse files
Files changed (1) hide show
  1. app.py +12 -5
app.py CHANGED
@@ -14,7 +14,7 @@ print("Loading SNAC model...")
14
  snac_model = SNAC.from_pretrained("hubertsiuzdak/snac_24khz")
15
  snac_model = snac_model.to(device)
16
 
17
- model_name = "syvai/tts-v0.2-finetuned"
18
 
19
  # Download only model config and safetensors
20
  snapshot_download(
@@ -149,24 +149,31 @@ def generate_speech(text, voice, temperature, top_p, repetition_penalty, max_new
149
 
150
  # Examples for the UI
151
  examples = [
 
152
  ["Velkommen til Anna! Hov, det er mig der er Anna. Håber du kan lide min stemme.", "anna", 0.2, 0.95, 1.1, 1200],
153
  ["Spørger man lykke friis, der er tysklandskender og direktør i Tænketanken europa, så kan man kun gætte på årsagerne, men er ikke gode venner med alle i regeringen.", "mic", 0.2, 0.95, 1.1, 1200],
154
  ["Det burde have været en formssag i Den Tyske Forbundsdag, men det endte som alt andet end det. For første gang i Forbundsrepublikkens historie fik kanslerkandidaten ikke nok stemmer til at sikre sig den fornemme titel som kansler, da der skulle stemmes i parlamentet.", "nic", 0.2, 0.95, 1.1, 2000],
155
  ]
156
 
157
  # Available voices
158
- VOICES = ["anna", "nic", "mic"]
159
 
160
  # Available Emotive Tags
161
  EMOTIVE_TAGS = []
162
 
163
  # Create Gradio interface
164
- with gr.Blocks(title="Syv.ai TTS v0.2") as demo:
165
  gr.Markdown(f"""
166
- # 🎵 [Syv.ai TTS v0.2](https://huggingface.co/syvai/tts-v0.2-finetuned)
167
  Skriv din tekst (gerne kortere end 200 tegn) nedenfor og hør hvad den kan.
168
 
169
- Vi har pt. kun 3 stemmer, og ingen måde at styre tone, grin eller andre paralinguistiske elementer. Vi arbejder dog på at udgive en model med bedre stemmestying.
 
 
 
 
 
 
170
 
171
  Syvai TTS er trænet på +1000 timer af dansk tale og bygger ovenpå en model fra [Orpheus TTS](https://huggingface.co/canopyai/Orpheus-TTS).
172
  """)
 
14
  snac_model = SNAC.from_pretrained("hubertsiuzdak/snac_24khz")
15
  snac_model = snac_model.to(device)
16
 
17
+ model_name = "syvai/tts-v0.3-finetuned"
18
 
19
  # Download only model config and safetensors
20
  snapshot_download(
 
149
 
150
  # Examples for the UI
151
  examples = [
152
+ ["Hej, mit navn er Sofie. <um> Jeg er 20 år gammel og studerer på KU. <chuckle> Jeg elsker at læse og spise is. Jeg elsker at grine. <laugh>. Jeg håber snart det bliver bedre vejr. <sigh>", "sofie", 0.2, 0.95, 1.1, 1200],
153
  ["Velkommen til Anna! Hov, det er mig der er Anna. Håber du kan lide min stemme.", "anna", 0.2, 0.95, 1.1, 1200],
154
  ["Spørger man lykke friis, der er tysklandskender og direktør i Tænketanken europa, så kan man kun gætte på årsagerne, men er ikke gode venner med alle i regeringen.", "mic", 0.2, 0.95, 1.1, 1200],
155
  ["Det burde have været en formssag i Den Tyske Forbundsdag, men det endte som alt andet end det. For første gang i Forbundsrepublikkens historie fik kanslerkandidaten ikke nok stemmer til at sikre sig den fornemme titel som kansler, da der skulle stemmes i parlamentet.", "nic", 0.2, 0.95, 1.1, 2000],
156
  ]
157
 
158
  # Available voices
159
+ VOICES = ["anna", "nic", "mic", "sofie"]
160
 
161
  # Available Emotive Tags
162
  EMOTIVE_TAGS = []
163
 
164
  # Create Gradio interface
165
+ with gr.Blocks(title="Syv.ai TTS v0.3") as demo:
166
  gr.Markdown(f"""
167
+ # 🎵 [Syv.ai TTS v0.3](https://huggingface.co/syvai/tts-v0.3-finetuned)
168
  Skriv din tekst (gerne kortere end 200 tegn) nedenfor og hør hvad den kan.
169
 
170
+ Vi har pt. 4 stemmer, og der kommer løbende flere til.
171
+
172
+ Sofie er vores nyeste stemme, og er trænet til at kunne udtrykke sig med grin, "øh" og andre paralinguistiske elementer.
173
+
174
+ Anna er vores første syntetiske stemme, dvs. ikke en rigtigt person, men distilleret fra en anden model.
175
+
176
+ Mic og Nic er rigtige personer, men er ikke trænet til at udtrykke sig med grin, "øh" og andre paralinguistiske elementer. De er gode til at oplæse tekster.
177
 
178
  Syvai TTS er trænet på +1000 timer af dansk tale og bygger ovenpå en model fra [Orpheus TTS](https://huggingface.co/canopyai/Orpheus-TTS).
179
  """)