Spaces:

gnosticdev
/

INVIDEO_BASIC

Running

App Files Files Community

gnosticdev commited on Jul 13

Commit

3d41bc8

verified ·

1 Parent(s): 506f1df

Update app.py

Browse files

Files changed (1) hide show

app.py +82 -52

app.py CHANGED Viewed

@@ -9,7 +9,7 @@ import gradio as gr
 import torch
 from transformers import GPT2Tokenizer, GPT2LMHeadModel
 from keybert import KeyBERT
-# Importación correcta: Solo 'concatenate_videoclips'
 from moviepy.editor import VideoFileClip, concatenate_videoclips, AudioFileClip, CompositeAudioClip, concatenate_audioclips, AudioClip
 import re
 import math
@@ -61,6 +61,34 @@ except Exception as e:
     logger.error(f"FALLA al cargar KeyBERT: {str(e)}", exc_info=True)
     kw_model = None
 def buscar_videos_pexels(query, api_key, per_page=5):
     if not api_key:
         logger.warning("No se puede buscar en Pexels: API Key no configurada.")
@@ -175,7 +203,7 @@ def generate_script(prompt, max_length=150):
         logger.warning("Usando prompt original como guion debido al error de generación.")
         return prompt.strip()
-# Función TTS con voz especificada
 async def text_to_speech(text, output_path, voice):
     logger.info(f"Convirtiendo texto a voz | Caracteres: {len(text)} | Voz: {voice} | Salida: {output_path}")
     if not text or not text.strip():
@@ -346,10 +374,11 @@ def extract_visual_keywords_from_script(script_text):
     logger.info(f"Palabras clave finales: {top_keywords}")
     return top_keywords
-def crear_video(prompt_type, input_text, musica_file=None):
     logger.info("="*80)
     logger.info(f"INICIANDO CREACIÓN DE VIDEO | Tipo: {prompt_type}")
     logger.debug(f"Input: '{input_text[:100]}...'")
     start_time = datetime.now()
     temp_dir_intermediate = None
@@ -380,35 +409,31 @@ def crear_video(prompt_type, input_text, musica_file=None):
         logger.info(f"Directorio temporal intermedio creado: {temp_dir_intermediate}")
         temp_intermediate_files = []
-        # 2. Generar audio de voz con reintentos y voz de respaldo
         logger.info("Generando audio de voz...")
         voz_path = os.path.join(temp_dir_intermediate, "voz.mp3")
-        primary_voice = "es-ES-JuanNeural"
-        fallback_voice = "es-ES-ElviraNeural" # Otra voz en español
-        tts_success = False
-        retries = 3
-        for attempt in range(retries):
-            current_voice = primary_voice if attempt == 0 else fallback_voice
-            if attempt > 0: logger.warning(f"Reintentando TTS ({attempt+1}/{retries})...")
-            logger.info(f"Intentando TTS con voz: {current_voice}")
-            try:
-                tts_success = asyncio.run(text_to_speech(guion, voz_path, voice=current_voice))
-                if tts_success:
-                    logger.info(f"TTS exitoso en intento {attempt + 1} con voz {current_voice}.")
-                    break
-            except Exception as e:
-                 pass
-            if not tts_success and attempt == 0 and primary_voice != fallback_voice:
-                 logger.warning(f"Fallo con voz {primary_voice}, intentando voz de respaldo: {fallback_voice}")
-            elif not tts_success and attempt < retries - 1:
-                 logger.warning(f"Fallo con voz {current_voice}, reintentando...")
         if not tts_success or not os.path.exists(voz_path) or os.path.getsize(voz_path) <= 100:
-             logger.error(f"Fallo en la generación de voz después de {retries} intentos. Archivo de audio no creado o es muy pequeño.")
              raise ValueError("Error generando voz a partir del guion (fallo de TTS).")
         temp_intermediate_files.append(voz_path)
@@ -843,12 +868,11 @@ def crear_video(prompt_type, input_text, musica_file=None):
              logger.info(f"Directorio temporal intermedio {temp_dir_intermediate} persistirá para que Gradio lea el video final.")
-# La función run_app ahora recibe todos los inputs de texto y el archivo de música
-def run_app(prompt_type, prompt_ia, prompt_manual, musica_file):
     logger.info("="*80)
     logger.info("SOLICITUD RECIBIDA EN INTERFAZ")
-    # Elegir el texto de entrada basado en el prompt_type
     input_text = prompt_ia if prompt_type == "Generar Guion con IA" else prompt_manual
     output_video = None
@@ -857,26 +881,30 @@ def run_app(prompt_type, prompt_ia, prompt_manual, musica_file):
     if not input_text or not input_text.strip():
         logger.warning("Texto de entrada vacío.")
-        # Retornar None para video y archivo, actualizar estado con mensaje de error
         return None, None, gr.update(value="⚠️ Por favor, ingresa texto para el guion o el tema.", interactive=False)
     logger.info(f"Tipo de entrada: {prompt_type}")
     logger.debug(f"Texto de entrada: '{input_text[:100]}...'")
     if musica_file:
         logger.info(f"Archivo de música recibido: {musica_file}")
     else:
         logger.info("No se proporcionó archivo de música.")
     try:
         logger.info("Llamando a crear_video...")
-        # Pasar el input_text elegido y el archivo de música a crear_video
-        video_path = crear_video(prompt_type, input_text, musica_file)
         if video_path and os.path.exists(video_path):
             logger.info(f"crear_video retornó path: {video_path}")
             logger.info(f"Tamaño del archivo de video retornado: {os.path.getsize(video_path)} bytes")
-            output_video = video_path # Establecer valor del componente de video
-            output_file = video_path   # Establecer valor del componente de archivo para descarga
             status_msg = gr.update(value="✅ Video generado exitosamente.", interactive=False)
         else:
             logger.error(f"crear_video no retornó un path válido o el archivo no existe: {video_path}")
@@ -890,7 +918,6 @@ def run_app(prompt_type, prompt_ia, prompt_manual, musica_file):
         status_msg = gr.update(value=f"❌ Error inesperado: {str(e)}", interactive=False)
     finally:
         logger.info("Fin del handler run_app.")
-        # Retornar las tres salidas esperadas por el evento click
         return output_video, output_file, status_msg
@@ -912,12 +939,11 @@ with gr.Blocks(title="Generador de Videos con IA", theme=gr.themes.Soft(), css="
             )
             # Contenedores para los campos de texto para controlar la visibilidad
-            # Nombrados para que coincidan con los outputs del evento change
             with gr.Column(visible=True) as ia_guion_column:
                 prompt_ia = gr.Textbox(
                     label="Tema para IA",
                     lines=2,
-                    placeholder="Ej: Un paisaje natural con montañas y ríos al amanecer, mostrando la belleza de la naturaleza...",
                     max_lines=4,
                     value=""
                 )
@@ -937,6 +963,16 @@ with gr.Blocks(title="Generador de Videos con IA", theme=gr.themes.Soft(), css="
                 interactive=True,
                 value=None
             )
             generate_btn = gr.Button("✨ Generar Video", variant="primary")
@@ -949,7 +985,7 @@ with gr.Blocks(title="Generador de Videos con IA", theme=gr.themes.Soft(), css="
             file_output = gr.File(
                 label="Descargar Archivo de Video",
                 interactive=False,
-                visible=False # Ocultar inicialmente
             )
             status_output = gr.Textbox(
                 label="Estado",
@@ -960,37 +996,30 @@ with gr.Blocks(title="Generador de Videos con IA", theme=gr.themes.Soft(), css="
             )
     # Evento para mostrar/ocultar los campos de texto según el tipo de prompt
-    # Apuntar a los componentes Column padre para controlar la visibilidad
     prompt_type.change(
         lambda x: (gr.update(visible=x == "Generar Guion con IA"),
                    gr.update(visible=x == "Usar Mi Guion")),
         inputs=prompt_type,
-        # Pasar los componentes Column
         outputs=[ia_guion_column, manual_guion_column]
     )
     # Evento click del botón de generar video
     generate_btn.click(
-        # Acción 1 (síncrona): Resetear salidas y establecer estado a procesando
-        # Retorna None para los 3 outputs iniciales
         lambda: (None, None, gr.update(value="⏳ Procesando... Esto puede tomar varios minutos.", interactive=False)),
         outputs=[video_output, file_output, status_output],
-        queue=True, # Usar la cola de Gradio para tareas largas
     ).then(
         # Acción 2 (asíncrona): Llamar a la función principal de procesamiento
         run_app,
-        # PASAR TODOS LOS INPUTS DE LA INTERFAZ que run_app espera
-        inputs=[prompt_type, prompt_ia, prompt_manual, musica_input],
-        # run_app retornará los 3 outputs esperados aquí
         outputs=[video_output, file_output, status_output]
     ).then(
         # Acción 3 (síncrona): Hacer visible el enlace de descarga si se retornó un archivo
-        # Esta función recibe las salidas de la Acción 2 (video_path, file_path, status_msg)
-        # Solo necesitamos video_path o file_path para decidir si mostrar el enlace
         lambda video_path, file_path, status_msg: gr.update(visible=file_path is not None),
-        # Inputs son las salidas de la función .then() anterior
         inputs=[video_output, file_output, status_output],
-        # Actualizamos la visibilidad del componente file_output
         outputs=[file_output]
     )
@@ -1002,10 +1031,11 @@ with gr.Blocks(title="Generador de Videos con IA", theme=gr.themes.Soft(), css="
         -   "Generar Guion con IA": Describe brevemente un tema (ej. "La belleza de las montañas"). La IA generará un guion corto.
         -   "Usar Mi Guion": Escribe el guion completo que quieres para el video.
     3.  **Sube música** (opcional): Selecciona un archivo de audio (MP3, WAV, etc.) para usar como música de fondo.
-    4.  **Haz clic en "✨ Generar Video"**.
-    5.  Espera a que se procese el video. El tiempo de espera puede variar. Verás el estado en el cuadro de texto.
-    6.  La previsualización del video aparecerá arriba (puede fallar para archivos grandes), y un enlace **Descargar Archivo de Video** se mostrará si la generación fue exitosa.
-    7.  Si hay errores, revisa el log `video_generator_full.log` para más detalles.
     """)
     gr.Markdown("---")
     gr.Markdown("Desarrollado por [Tu Nombre/Empresa/Alias - Opcional]")

 import torch
 from transformers import GPT2Tokenizer, GPT2LMHeadModel
 from keybert import KeyBERT
+# Importación correcta
 from moviepy.editor import VideoFileClip, concatenate_videoclips, AudioFileClip, CompositeAudioClip, concatenate_audioclips, AudioClip
 import re
 import math
     logger.error(f"FALLA al cargar KeyBERT: {str(e)}", exc_info=True)
     kw_model = None
+# --- NUEVA FUNCIÓN: Obtener voces de Edge TTS ---
+async def get_available_voices():
+    logger.info("Obteniendo lista de voces disponibles de Edge TTS...")
+    try:
+        voices = await edge_tts.VoicesManager.create()
+        # Filtrar solo voces en español si prefieres, o dejar todas
+        # es_voices = [voice.Name for voice in voices.Voices if voice.Locale.startswith('es-')]
+        # return es_voices if es_voices else [voice.Name for voice in voices.Voices]
+        # O simplemente retornar todas las voces
+        all_voices = [voice.Name for voice in voices.Voices]
+        logger.info(f"Encontradas {len(all_voices)} voces de Edge TTS.")
+        return all_voices
+    except Exception as e:
+        logger.error(f"Error obteniendo voces de Edge TTS: {str(e)}", exc_info=True)
+        # Retornar una lista de voces por defecto si falla la API de Edge TTS
+        logger.warning("No se pudieron obtener voces de Edge TTS. Usando lista de voces por defecto.")
+        return ["es-ES-JuanNeural", "es-ES-ElviraNeural", "en-US-AriaNeural"]
+# Obtener las voces al inicio del script (esto puede tardar un poco)
+logger.info("Inicializando lista de voces disponibles...")
+AVAILABLE_VOICES = asyncio.run(get_available_voices())
+# Establecer una voz por defecto inicial
+DEFAULT_VOICE = "es-ES-JuanNeural" if "es-ES-JuanNeural" in AVAILABLE_VOICES else (AVAILABLE_VOICES[0] if AVAILABLE_VOICES else "en-US-AriaNeural")
+logger.info(f"Voz por defecto seleccionada: {DEFAULT_VOICE}")
 def buscar_videos_pexels(query, api_key, per_page=5):
     if not api_key:
         logger.warning("No se puede buscar en Pexels: API Key no configurada.")
         logger.warning("Usando prompt original como guion debido al error de generación.")
         return prompt.strip()
+# Función TTS ahora recibe la voz a usar
 async def text_to_speech(text, output_path, voice):
     logger.info(f"Convirtiendo texto a voz | Caracteres: {len(text)} | Voz: {voice} | Salida: {output_path}")
     if not text or not text.strip():
     logger.info(f"Palabras clave finales: {top_keywords}")
     return top_keywords
+def crear_video(prompt_type, input_text, selected_voice, musica_file=None): # <-- AHORA RECIBE selected_voice
     logger.info("="*80)
     logger.info(f"INICIANDO CREACIÓN DE VIDEO | Tipo: {prompt_type}")
     logger.debug(f"Input: '{input_text[:100]}...'")
+    logger.info(f"Voz seleccionada para TTS: {selected_voice}") # <-- LOGUEAR la voz seleccionada
     start_time = datetime.now()
     temp_dir_intermediate = None
         logger.info(f"Directorio temporal intermedio creado: {temp_dir_intermediate}")
         temp_intermediate_files = []
+        # 2. Generar audio de voz usando la voz seleccionada
         logger.info("Generando audio de voz...")
         voz_path = os.path.join(temp_dir_intermediate, "voz.mp3")
+        # Ya no necesitamos reintentos/fallback aquí, la voz viene seleccionada
+        tts_success = asyncio.run(text_to_speech(guion, voz_path, voice=selected_voice))
+        # Si falla la generación con la voz seleccionada, intentar con una voz de respaldo
+        if not tts_success:
+             logger.warning(f"La generación de TTS falló con la voz seleccionada '{selected_voice}'. Intentando con voz de respaldo 'es-ES-ElviraNeural'.")
+             fallback_voice = "es-ES-ElviraNeural"
+             if selected_voice == fallback_voice: # Evitar reintentar con la misma voz fallida
+                  fallback_voice = "en-US-AriaNeural" # O alguna otra conocida
+                  logger.warning(f"La voz de respaldo era la misma que falló. Intentando otra voz de respaldo: {fallback_voice}")
+             tts_success = asyncio.run(text_to_speech(guion, voz_path, voice=fallback_voice))
+             if tts_success:
+                  logger.info(f"TTS exitoso con voz de respaldo: {fallback_voice}.")
+             else:
+                  logger.error(f"La generación de TTS falló también con la voz de respaldo.")
+        # Verificar si el archivo fue creado después de los intentos
         if not tts_success or not os.path.exists(voz_path) or os.path.getsize(voz_path) <= 100:
+             logger.error(f"Fallo en la generación de voz. Archivo de audio no creado o es muy pequeño.")
              raise ValueError("Error generando voz a partir del guion (fallo de TTS).")
         temp_intermediate_files.append(voz_path)
              logger.info(f"Directorio temporal intermedio {temp_dir_intermediate} persistirá para que Gradio lea el video final.")
+# run_app ahora recibe todos los inputs, incluyendo la voz seleccionada
+def run_app(prompt_type, prompt_ia, prompt_manual, musica_file, selected_voice): # <-- AHORA RECIBE selected_voice
     logger.info("="*80)
     logger.info("SOLICITUD RECIBIDA EN INTERFAZ")
     input_text = prompt_ia if prompt_type == "Generar Guion con IA" else prompt_manual
     output_video = None
     if not input_text or not input_text.strip():
         logger.warning("Texto de entrada vacío.")
         return None, None, gr.update(value="⚠️ Por favor, ingresa texto para el guion o el tema.", interactive=False)
+    if not selected_voice or selected_voice not in AVAILABLE_VOICES:
+        logger.warning(f"Voz seleccionada inválida o vacía: '{selected_voice}'. Usando voz por defecto: {DEFAULT_VOICE}.")
+        selected_voice = DEFAULT_VOICE # Usar voz por defecto si la seleccionada es inválida
     logger.info(f"Tipo de entrada: {prompt_type}")
     logger.debug(f"Texto de entrada: '{input_text[:100]}...'")
     if musica_file:
         logger.info(f"Archivo de música recibido: {musica_file}")
     else:
         logger.info("No se proporcionó archivo de música.")
+    logger.info(f"Voz seleccionada (validada): {selected_voice}") # Loguear la voz validada
     try:
         logger.info("Llamando a crear_video...")
+        # Pasar la voz seleccionada a crear_video
+        video_path = crear_video(prompt_type, input_text, selected_voice, musica_file) # <-- PASAR selected_voice
         if video_path and os.path.exists(video_path):
             logger.info(f"crear_video retornó path: {video_path}")
             logger.info(f"Tamaño del archivo de video retornado: {os.path.getsize(video_path)} bytes")
+            output_video = video_path
+            output_file = video_path
             status_msg = gr.update(value="✅ Video generado exitosamente.", interactive=False)
         else:
             logger.error(f"crear_video no retornó un path válido o el archivo no existe: {video_path}")
         status_msg = gr.update(value=f"❌ Error inesperado: {str(e)}", interactive=False)
     finally:
         logger.info("Fin del handler run_app.")
         return output_video, output_file, status_msg
             )
             # Contenedores para los campos de texto para controlar la visibilidad
             with gr.Column(visible=True) as ia_guion_column:
                 prompt_ia = gr.Textbox(
                     label="Tema para IA",
                     lines=2,
+                    placeholder="Ej: Un paisaje natural con montañas y ríos al amanecer...",
                     max_lines=4,
                     value=""
                 )
                 interactive=True,
                 value=None
             )
+            # --- NUEVO COMPONENTE: Selección de Voz ---
+            voice_dropdown = gr.Dropdown(
+                label="Seleccionar Voz para Guion",
+                choices=AVAILABLE_VOICES, # Usar la lista obtenida al inicio
+                value=DEFAULT_VOICE,      # Usar la voz por defecto calculada
+                interactive=True
+            )
+            # --- FIN NUEVO COMPONENTE ---
             generate_btn = gr.Button("✨ Generar Video", variant="primary")
             file_output = gr.File(
                 label="Descargar Archivo de Video",
                 interactive=False,
+                visible=False
             )
             status_output = gr.Textbox(
                 label="Estado",
             )
     # Evento para mostrar/ocultar los campos de texto según el tipo de prompt
     prompt_type.change(
         lambda x: (gr.update(visible=x == "Generar Guion con IA"),
                    gr.update(visible=x == "Usar Mi Guion")),
         inputs=prompt_type,
         outputs=[ia_guion_column, manual_guion_column]
     )
     # Evento click del botón de generar video
     generate_btn.click(
+        # Acción 1 (síncrona): Resetear salidas y establecer estado
         lambda: (None, None, gr.update(value="⏳ Procesando... Esto puede tomar varios minutos.", interactive=False)),
         outputs=[video_output, file_output, status_output],
+        queue=True,
     ).then(
         # Acción 2 (asíncrona): Llamar a la función principal de procesamiento
         run_app,
+        # PASAR TODOS LOS INPUTS DE LA INTERFAZ a run_app
+        inputs=[prompt_type, prompt_ia, prompt_manual, musica_input, voice_dropdown], # <-- AHORA PASAMOS voice_dropdown
+        # run_app retornará los 3 outputs esperados
         outputs=[video_output, file_output, status_output]
     ).then(
         # Acción 3 (síncrona): Hacer visible el enlace de descarga si se retornó un archivo
         lambda video_path, file_path, status_msg: gr.update(visible=file_path is not None),
         inputs=[video_output, file_output, status_output],
         outputs=[file_output]
     )
         -   "Generar Guion con IA": Describe brevemente un tema (ej. "La belleza de las montañas"). La IA generará un guion corto.
         -   "Usar Mi Guion": Escribe el guion completo que quieres para el video.
     3.  **Sube música** (opcional): Selecciona un archivo de audio (MP3, WAV, etc.) para usar como música de fondo.
+    4.  **Selecciona la voz** para el guion.
+    5.  **Haz clic en "✨ Generar Video"**.
+    6.  Espera a que se procese el video. El tiempo de espera puede variar. Verás el estado en el cuadro de texto.
+    7.  La previsualización del video aparecerá arriba (puede fallar para archivos grandes), y un enlace **Descargar Archivo de Video** se mostrará si la generación fue exitosa.
+    8.  Si hay errores, revisa el log `video_generator_full.log` para más detalles.
     """)
     gr.Markdown("---")
     gr.Markdown("Desarrollado por [Tu Nombre/Empresa/Alias - Opcional]")