Spaces:

PineSearch
/

generateAudio

Paused

App Files Files Community

SAUL19 commited on Jun 26, 2023

Commit

cb831b1

1 Parent(s): 04db253

Update app.py

Browse files

Files changed (1) hide show

app.py +12 -15

app.py CHANGED Viewed

@@ -76,7 +76,7 @@ def generateAudio(text_to_audio, s3_save_as, key_id):
     def save_text_to_speech(text, speaker=None):
         # Preprocess text and recortar
         text = cut_text(text, max_tokens=500)
         # Verificar si el texto tiene menos de 30 palabras
         palabras = text.split()
         if len(palabras) <= 30:
@@ -90,11 +90,20 @@ def generateAudio(text_to_audio, s3_save_as, key_id):
             speech = model.generate_speech(
                 inputs["input_ids"], speaker_embeddings, vocoder=vocoder)
             combined_audio = speech
         else:
             # Divide el texto en segmentos de 30 palabras
             segmentos = [' '.join(palabras[i:i+30])
                          for i in range(0, len(palabras), 30)]
             # Generar audio para cada segmento y combinarlos
             audio_segments = []
             for segment in segmentos:
@@ -108,24 +117,12 @@ def generateAudio(text_to_audio, s3_save_as, key_id):
                 speech = model.generate_speech(
                     inputs["input_ids"], speaker_embeddings, vocoder=vocoder)
                 audio_segments.append(speech)
             if len(audio_segments) > 0:
                 combined_audio = torch.cat(audio_segments, dim=0)
             else:
                 combined_audio = None
-        if combined_audio is not None:
-            # Crear objeto BytesIO para almacenar el audio
-            audio_buffer = BytesIO()
-            sf.write(audio_buffer, combined_audio.cpu().numpy(),
-                     samplerate=16000, format='WAV')
-            audio_buffer.seek(0)
-            # Guardar el audio combinado en S3
-            save_audio_to_s3(audio_buffer)
-        else:
-            print("File with content null")
     save_text_to_speech(text_to_audio, 2271)
     return s3_save_as

     def save_text_to_speech(text, speaker=None):
         # Preprocess text and recortar
         text = cut_text(text, max_tokens=500)
         # Verificar si el texto tiene menos de 30 palabras
         palabras = text.split()
         if len(palabras) <= 30:
             speech = model.generate_speech(
                 inputs["input_ids"], speaker_embeddings, vocoder=vocoder)
             combined_audio = speech
+            # Crear objeto BytesIO para almacenar el audio
+            audio_buffer = BytesIO()
+            sf.write(audio_buffer, combined_audio.cpu().numpy(),
+                     samplerate=16000, format='WAV')
+            audio_buffer.seek(0)
+            # Guardar el audio combinado en S3
+            save_audio_to_s3(audio_buffer)
         else:
             # Divide el texto en segmentos de 30 palabras
             segmentos = [' '.join(palabras[i:i+30])
                          for i in range(0, len(palabras), 30)]
             # Generar audio para cada segmento y combinarlos
             audio_segments = []
             for segment in segmentos:
                 speech = model.generate_speech(
                     inputs["input_ids"], speaker_embeddings, vocoder=vocoder)
                 audio_segments.append(speech)
             if len(audio_segments) > 0:
                 combined_audio = torch.cat(audio_segments, dim=0)
             else:
                 combined_audio = None
     save_text_to_speech(text_to_audio, 2271)
     return s3_save_as