Spaces:

Ntdeseb
/

ntia

Running

App Files Files Community

Ntdeseb commited on Aug 4

Commit

b400c3e

1 Parent(s): 34fc777

Corregir problemas de generación de video - Corregido nombre del modelo AnimateDiff-Lightning-v1.0, evitado múltiples ejecuciones simultáneas, arreglado procesamiento de video con forma (batch, frames, height, width, channels)

Browse files

Files changed (1) hide show

app.py +52 -9

app.py CHANGED Viewed

@@ -122,7 +122,7 @@ MODELS = {
     },
     "video": {
         # ⚡ Modelos Rápidos (Optimizados para ZeroGPU)
-        "ByteDance/AnimateDiff-Lightning": "⚡ AnimateDiff Lightning (Más rápido)",
         "cerspense/zeroscope_v2_576w": "⚡ Zeroscope v2 576w (Rápido)",
         "damo-vilab/text-to-video-ms-1.7b": "⚡ Text-to-Video MS 1.7B (Rápido)",
@@ -150,6 +150,9 @@ MODELS = {
 # Cache para los modelos
 model_cache = {}
 def load_text_model(model_name):
     """Cargar modelo de texto"""
     if model_name not in model_cache:
@@ -546,7 +549,7 @@ def load_video_model(model_name):
             # Modelos optimizados para velocidad
             fast_models = [
-                "ByteDance/AnimateDiff-Lightning",
                 "cerspense/zeroscope_v2_576w",
                 "damo-vilab/text-to-video-ms-1.7b"
             ]
@@ -690,6 +693,15 @@ def load_video_model(model_name):
 @spaces.GPU(compute_unit="gpu.t4.micro", timeout=60)  # Timeout de 60 segundos para video
 def generate_video(prompt, model_name, num_frames=16, num_inference_steps=20):
     """Generar video optimizado con ZeroGPU H200"""
     try:
         print(f"🎬 Iniciando generación de video...")
         print(f"📝 Modelo: {model_name}")
@@ -811,9 +823,35 @@ def generate_video(prompt, model_name, num_frames=16, num_inference_steps=20):
                     return temp_path
                 elif len(video_frames.shape) == 5:  # (batch, frames, height, width, channels)
-                    # Tomar el primer batch
-                    frames = video_frames[0]
-                    return generate_video(prompt, model_name, optimized_frames, optimized_steps)
                 else:
                     print(f"❌ Forma no reconocida: {video_frames.shape}")
                     return None
@@ -844,6 +882,11 @@ def generate_video(prompt, model_name, num_frames=16, num_inference_steps=20):
         import traceback
         traceback.print_exc()
         raise Exception(f"Error generando video con {model_name}: {error_message}")
 def generate_text(prompt, model_name, max_length=100):
     """Generar texto con el modelo seleccionado"""
@@ -1447,7 +1490,7 @@ with gr.Blocks(title="Modelos Libres de IA", theme=gr.themes.Soft()) as demo:
                 with gr.Column():
                     video_model = gr.Dropdown(
                         choices=list(MODELS["video"].keys()),
-                        value="ByteDance/AnimateDiff-Lightning",  # Modelo más rápido por defecto
                         label="Modelo de Video",
                         info="⚡ Modelos marcados son más rápidos"
                     )
@@ -1483,8 +1526,8 @@ with gr.Blocks(title="Modelos Libres de IA", theme=gr.themes.Soft()) as demo:
                 with gr.Column():
                     # Información del modelo
                     video_model_info = gr.Markdown(
-                        value="**Modelo:** ByteDance/AnimateDiff-Lightning\n\n"
-                              "⚡ AnimateDiff Lightning • Frames recomendados: 8-16 • "
                               "Pasos recomendados: 10-20 • Velocidad: Muy rápida\n\n"
                               "**Estado:** ✅ Disponible • **Optimizado para ZeroGPU**"
                     )
@@ -1512,7 +1555,7 @@ with gr.Blocks(title="Modelos Libres de IA", theme=gr.themes.Soft()) as demo:
             # Función para actualizar info del modelo de video
             def update_video_model_info(model_name):
                 model_descriptions = {
-                    "ByteDance/AnimateDiff-Lightning": "⚡ AnimateDiff Lightning • Frames recomendados: 8-16 • Pasos recomendados: 10-20 • Velocidad: Muy rápida",
                     "cerspense/zeroscope_v2_576w": "⚡ Zeroscope v2 576w • Frames recomendados: 8-16 • Pasos recomendados: 10-20 • Velocidad: Rápida",
                     "damo-vilab/text-to-video-ms-1.7b": "⚡ Text-to-Video MS 1.7B • Frames recomendados: 8-16 • Pasos recomendados: 10-20 • Velocidad: Rápida",
                     "cerspense/zeroscope_v2_XL": "🎬 Zeroscope v2 XL • Frames recomendados: 12-24 • Pasos recomendados: 20-30 • Velocidad: Media",

     },
     "video": {
         # ⚡ Modelos Rápidos (Optimizados para ZeroGPU)
+        "ByteDance/AnimateDiff-Lightning-v1.0": "⚡ AnimateDiff Lightning v1.0 (Más rápido)",
         "cerspense/zeroscope_v2_576w": "⚡ Zeroscope v2 576w (Rápido)",
         "damo-vilab/text-to-video-ms-1.7b": "⚡ Text-to-Video MS 1.7B (Rápido)",
 # Cache para los modelos
 model_cache = {}
+# Variable para evitar múltiples ejecuciones simultáneas
+video_generation_in_progress = False
 def load_text_model(model_name):
     """Cargar modelo de texto"""
     if model_name not in model_cache:
             # Modelos optimizados para velocidad
             fast_models = [
+                "ByteDance/AnimateDiff-Lightning-v1.0",
                 "cerspense/zeroscope_v2_576w",
                 "damo-vilab/text-to-video-ms-1.7b"
             ]
 @spaces.GPU(compute_unit="gpu.t4.micro", timeout=60)  # Timeout de 60 segundos para video
 def generate_video(prompt, model_name, num_frames=16, num_inference_steps=20):
     """Generar video optimizado con ZeroGPU H200"""
+    global video_generation_in_progress
+    # Evitar múltiples ejecuciones simultáneas
+    if video_generation_in_progress:
+        print("⚠️ Ya hay una generación de video en progreso, esperando...")
+        return "⏳ Ya hay una generación de video en progreso. Espera a que termine."
+    video_generation_in_progress = True
     try:
         print(f"🎬 Iniciando generación de video...")
         print(f"📝 Modelo: {model_name}")
                     return temp_path
                 elif len(video_frames.shape) == 5:  # (batch, frames, height, width, channels)
+                    # Tomar el primer batch y procesar correctamente
+                    print("🔄 Procesando video con forma (batch, frames, height, width, channels)")
+                    frames = video_frames[0]  # Tomar el primer batch
+                    # Convertir frames a formato de video
+                    frames_list = []
+                    for i in range(frames.shape[0]):
+                        frame = frames[i]
+                        # Asegurar que el frame esté en el rango correcto (0-255)
+                        if frame.dtype == np.float32 or frame.dtype == np.float16:
+                            frame = (frame * 255).astype(np.uint8)
+                        frames_list.append(frame)
+                    # Crear video a partir de frames
+                    import imageio
+                    import tempfile
+                    import os
+                    # Crear archivo temporal
+                    with tempfile.NamedTemporaryFile(suffix='.mp4', delete=False) as tmp_file:
+                        temp_path = tmp_file.name
+                    # Guardar frames como video con FPS optimizado
+                    fps = 8 if is_fast_model else 6
+                    imageio.mimsave(temp_path, frames_list, fps=fps)
+                    print(f"💾 Video guardado en: {temp_path}")
+                    print(f"🎬 FPS del video: {fps}")
+                    return temp_path
                 else:
                     print(f"❌ Forma no reconocida: {video_frames.shape}")
                     return None
         import traceback
         traceback.print_exc()
         raise Exception(f"Error generando video con {model_name}: {error_message}")
+    finally:
+        # Siempre liberar la bandera al finalizar
+        video_generation_in_progress = False
+        print("✅ Generación de video completada, liberando recursos")
 def generate_text(prompt, model_name, max_length=100):
     """Generar texto con el modelo seleccionado"""
                 with gr.Column():
                     video_model = gr.Dropdown(
                         choices=list(MODELS["video"].keys()),
+                        value="ByteDance/AnimateDiff-Lightning-v1.0",  # Modelo más rápido por defecto
                         label="Modelo de Video",
                         info="⚡ Modelos marcados son más rápidos"
                     )
                 with gr.Column():
                     # Información del modelo
                     video_model_info = gr.Markdown(
+                        value="**Modelo:** ByteDance/AnimateDiff-Lightning-v1.0\n\n"
+                              "⚡ AnimateDiff Lightning v1.0 • Frames recomendados: 8-16 • "
                               "Pasos recomendados: 10-20 • Velocidad: Muy rápida\n\n"
                               "**Estado:** ✅ Disponible • **Optimizado para ZeroGPU**"
                     )
             # Función para actualizar info del modelo de video
             def update_video_model_info(model_name):
                 model_descriptions = {
+                    "ByteDance/AnimateDiff-Lightning-v1.0": "⚡ AnimateDiff Lightning v1.0 • Frames recomendados: 8-16 • Pasos recomendados: 10-20 • Velocidad: Muy rápida",
                     "cerspense/zeroscope_v2_576w": "⚡ Zeroscope v2 576w • Frames recomendados: 8-16 • Pasos recomendados: 10-20 • Velocidad: Rápida",
                     "damo-vilab/text-to-video-ms-1.7b": "⚡ Text-to-Video MS 1.7B • Frames recomendados: 8-16 • Pasos recomendados: 10-20 • Velocidad: Rápida",
                     "cerspense/zeroscope_v2_XL": "🎬 Zeroscope v2 XL • Frames recomendados: 12-24 • Pasos recomendados: 20-30 • Velocidad: Media",