File size: 1,298 Bytes
731f5f1
 
 
80f220d
731f5f1
0d614eb
731f5f1
 
7604add
731f5f1
7604add
731f5f1
 
 
 
 
 
 
 
 
 
 
 
09721db
c1a762c
731f5f1
09721db
731f5f1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
import gradio as gr
import os 
# Instalar Python 3.10.7
#os.system("pip install python==3.8.9")
os.system('/usr/local/bin/python -m pip install --upgrade pip')
os.system("pip install git+https://github.com/allthingssecurity/vall-e/")
os.system("pip install pydub")
from pydub import AudioSegment
import tempfile

def synthesis(audio_file: tempfile._TemporaryFileWrapper, text: str, ar_ckpt: str, nar_ckpt: str):
    # Cargar el archivo de audio de entrada
    audio = AudioSegment.from_file(audio_file)
    # Exportar el archivo de audio a un archivo temporal
    temp_file = "temp.wav"
    audio.export(temp_file, format="wav")
    # Utilizar la función de síntesis de vall-e para generar un archivo de audio de salida
    output_file = "output.wav"
    vall_e.synthesis(text, temp_file, output_file, ar_ckpt=ar_ckpt, nar_ckpt=nar_ckpt)
    # Cargar el archivo de audio de salida
    output_audio = AudioSegment.from_file(output_file)
    return output_audio

synthesis_interface = gr.Interface(synthesis,
                                  inputs={"audio_file": gr.File(file_count="multiple"), "text": "text", "ar_ckpt": "text", "nar_ckpt": "text"},
                                  live=True,
                                  capture_session=True,outputs="audio")
synthesis_interface.launch()