Spaces:

Kvikontent
/

text2speech

Runtime error

Kvikontent commited on Oct 8, 2023

Commit

c6a567c

1 Parent(s): 5d285d6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,20 +2,21 @@ import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer
 # Load the model and tokenizer
-model_name = "suno/bark-small"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
 # Define the Gradio interface
 def text_to_speech(text):
     # Tokenize the input text
-    inputs = tokenizer.encode(text, return_tensors="pt")
     # Generate speech from the input text using the loaded model
-    outputs = model.generate(inputs)
     # Convert the generated speech tensor to audio format
-    speech = gradio.inputs.Audio(outputs)
     return speech

 from transformers import AutoModelForCausalLM, AutoTokenizer
 # Load the model and tokenizer
+model_name = "facebook/wav2vec2-large-xlsr-53"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
 # Define the Gradio interface
 def text_to_speech(text):
     # Tokenize the input text
+    inputs = tokenizer(text, return_tensors="pt", padding=True)
     # Generate speech from the input text using the loaded model
+    with torch.no_grad():
+        outputs = model.generate(**inputs)
     # Convert the generated speech tensor to audio format
+    speech = gradio.inputs.Audio(outputs[0].numpy().tolist(), type='torch')
     return speech