Spaces:
Running
on
Zero
Running
on
Zero
mhenrhcsen
commited on
Commit
·
e13466b
1
Parent(s):
0f81137
Update app.py to change the model name to "syvai/tts-v0.3-finetuned", add a new example for the voice "sofie", and update the Gradio interface title and description to reflect the new version and additional voice capabilities.
Browse files
app.py
CHANGED
@@ -14,7 +14,7 @@ print("Loading SNAC model...")
|
|
14 |
snac_model = SNAC.from_pretrained("hubertsiuzdak/snac_24khz")
|
15 |
snac_model = snac_model.to(device)
|
16 |
|
17 |
-
model_name = "syvai/tts-v0.
|
18 |
|
19 |
# Download only model config and safetensors
|
20 |
snapshot_download(
|
@@ -149,24 +149,31 @@ def generate_speech(text, voice, temperature, top_p, repetition_penalty, max_new
|
|
149 |
|
150 |
# Examples for the UI
|
151 |
examples = [
|
|
|
152 |
["Velkommen til Anna! Hov, det er mig der er Anna. Håber du kan lide min stemme.", "anna", 0.2, 0.95, 1.1, 1200],
|
153 |
["Spørger man lykke friis, der er tysklandskender og direktør i Tænketanken europa, så kan man kun gætte på årsagerne, men er ikke gode venner med alle i regeringen.", "mic", 0.2, 0.95, 1.1, 1200],
|
154 |
["Det burde have været en formssag i Den Tyske Forbundsdag, men det endte som alt andet end det. For første gang i Forbundsrepublikkens historie fik kanslerkandidaten ikke nok stemmer til at sikre sig den fornemme titel som kansler, da der skulle stemmes i parlamentet.", "nic", 0.2, 0.95, 1.1, 2000],
|
155 |
]
|
156 |
|
157 |
# Available voices
|
158 |
-
VOICES = ["anna", "nic", "mic"]
|
159 |
|
160 |
# Available Emotive Tags
|
161 |
EMOTIVE_TAGS = []
|
162 |
|
163 |
# Create Gradio interface
|
164 |
-
with gr.Blocks(title="Syv.ai TTS v0.
|
165 |
gr.Markdown(f"""
|
166 |
-
# 🎵 [Syv.ai TTS v0.
|
167 |
Skriv din tekst (gerne kortere end 200 tegn) nedenfor og hør hvad den kan.
|
168 |
|
169 |
-
Vi har pt.
|
|
|
|
|
|
|
|
|
|
|
|
|
170 |
|
171 |
Syvai TTS er trænet på +1000 timer af dansk tale og bygger ovenpå en model fra [Orpheus TTS](https://huggingface.co/canopyai/Orpheus-TTS).
|
172 |
""")
|
|
|
14 |
snac_model = SNAC.from_pretrained("hubertsiuzdak/snac_24khz")
|
15 |
snac_model = snac_model.to(device)
|
16 |
|
17 |
+
model_name = "syvai/tts-v0.3-finetuned"
|
18 |
|
19 |
# Download only model config and safetensors
|
20 |
snapshot_download(
|
|
|
149 |
|
150 |
# Examples for the UI
|
151 |
examples = [
|
152 |
+
["Hej, mit navn er Sofie. <um> Jeg er 20 år gammel og studerer på KU. <chuckle> Jeg elsker at læse og spise is. Jeg elsker at grine. <laugh>. Jeg håber snart det bliver bedre vejr. <sigh>", "sofie", 0.2, 0.95, 1.1, 1200],
|
153 |
["Velkommen til Anna! Hov, det er mig der er Anna. Håber du kan lide min stemme.", "anna", 0.2, 0.95, 1.1, 1200],
|
154 |
["Spørger man lykke friis, der er tysklandskender og direktør i Tænketanken europa, så kan man kun gætte på årsagerne, men er ikke gode venner med alle i regeringen.", "mic", 0.2, 0.95, 1.1, 1200],
|
155 |
["Det burde have været en formssag i Den Tyske Forbundsdag, men det endte som alt andet end det. For første gang i Forbundsrepublikkens historie fik kanslerkandidaten ikke nok stemmer til at sikre sig den fornemme titel som kansler, da der skulle stemmes i parlamentet.", "nic", 0.2, 0.95, 1.1, 2000],
|
156 |
]
|
157 |
|
158 |
# Available voices
|
159 |
+
VOICES = ["anna", "nic", "mic", "sofie"]
|
160 |
|
161 |
# Available Emotive Tags
|
162 |
EMOTIVE_TAGS = []
|
163 |
|
164 |
# Create Gradio interface
|
165 |
+
with gr.Blocks(title="Syv.ai TTS v0.3") as demo:
|
166 |
gr.Markdown(f"""
|
167 |
+
# 🎵 [Syv.ai TTS v0.3](https://huggingface.co/syvai/tts-v0.3-finetuned)
|
168 |
Skriv din tekst (gerne kortere end 200 tegn) nedenfor og hør hvad den kan.
|
169 |
|
170 |
+
Vi har pt. 4 stemmer, og der kommer løbende flere til.
|
171 |
+
|
172 |
+
Sofie er vores nyeste stemme, og er trænet til at kunne udtrykke sig med grin, "øh" og andre paralinguistiske elementer.
|
173 |
+
|
174 |
+
Anna er vores første syntetiske stemme, dvs. ikke en rigtigt person, men distilleret fra en anden model.
|
175 |
+
|
176 |
+
Mic og Nic er rigtige personer, men er ikke trænet til at udtrykke sig med grin, "øh" og andre paralinguistiske elementer. De er gode til at oplæse tekster.
|
177 |
|
178 |
Syvai TTS er trænet på +1000 timer af dansk tale og bygger ovenpå en model fra [Orpheus TTS](https://huggingface.co/canopyai/Orpheus-TTS).
|
179 |
""")
|