Spaces:

gnosticdev
/

INVIDEO_BASIC

Sleeping

App Files Files Community

gnosticdev commited on Jun 16

Commit

d5141b3

verified ·

1 Parent(s): 6c4f60d

Update app.py

Browse files

Files changed (1) hide show

app.py +173 -88

app.py CHANGED Viewed

@@ -10,10 +10,10 @@ from datetime import datetime
 import numpy as np
 from sklearn.feature_extraction.text import TfidfVectorizer
 import nltk
 from transformers import pipeline
 import torch
-import asyncio
-import time
 # Configuración inicial
 nltk.download('punkt', quiet=True)
@@ -22,83 +22,165 @@ logger = logging.getLogger(__name__)
 # Configuración de modelos
 PEXELS_API_KEY = os.getenv("PEXELS_API_KEY")
-MODEL_NAME = "DeepESP/gpt2-spanish"  # Modelo en español
 # Lista de voces disponibles
-VOICES = asyncio.run(edge_tts.list_voices())
-VOICE_NAMES = [f"{v['Name']} ({v['Gender']}, {v['Locale']})" for v in VOICES]
 def generar_guion_profesional(prompt):
-    """Genera guiones detallados"""
-    generator = pipeline(
-        "text-generation",
-        model=MODEL_NAME,
-        device=0 if torch.cuda.is_available() else -1
-    )
-    response = generator(
-        f"Escribe un guion profesional para un video de YouTube sobre '{prompt}':",
-        max_length=600,
-        temperature=0.7,
-        num_return_sequences=1
-    )
-    return response[0]['generated_text']
 def buscar_videos_avanzado(prompt, guion, num_videos=5):
     """Búsqueda inteligente de videos usando análisis de contenido"""
-    # Dividir el guion en oraciones
-    oraciones = nltk.sent_tokenize(guion)
-    # Extraer palabras clave con TF-IDF
-    vectorizer = TfidfVectorizer(stop_words=['el', 'la', 'los', 'las', 'de', 'en', 'y', 'que'])
-    tfidf = vectorizer.fit_transform(oraciones)
-    palabras = vectorizer.get_feature_names_out()
-    scores = np.asarray(tfidf.sum(axis=0)).ravel()
-    indices_importantes = np.argsort(scores)[-5:]
-    palabras_clave = [palabras[i] for i in indices_importantes]
-    # Mezclar palabras clave del prompt y del guion
-    palabras_prompt = re.findall(r'\b\w{4,}\b', prompt.lower())
-    todas_palabras = list(set(palabras_clave + palabras_prompt))[:5]
-    # Buscar en Pexels
-    headers = {"Authorization": PEXELS_API_KEY}
-    response = requests.get(
-        f"https://api.pexels.com/videos/search?query={'+'.join(todas_palabras)}&per_page={num_videos}",
-        headers=headers,
-        timeout=10
-    )
-    videos = response.json().get('videos', [])
-    # Seleccionar videos de mejor calidad
-    return sorted(
-        videos,
-        key=lambda x: x.get('width', 0) * x.get('height', 0),
-        reverse=True
-    )[:num_videos]
-async def crear_video_profesional(prompt, custom_script, voz_index, musica=None):
     try:
-        # 1. Generar o usar guion
         guion = custom_script if custom_script else generar_guion_profesional(prompt)
         # 2. Seleccionar voz
         voz_seleccionada = VOICES[voz_index]['ShortName']
-        # 3. Generar voz
         voz_archivo = "voz.mp3"
         await edge_tts.Communicate(guion, voz_seleccionada).save(voz_archivo)
         audio = AudioFileClip(voz_archivo)
         duracion_total = audio.duration
-        # 4. Buscar videos relevantes
         videos_data = buscar_videos_avanzado(prompt, guion)
-        # 5. Descargar y preparar videos
         clips = []
-        for video in videos_data:
             # Seleccionar la mejor calidad de video
             video_files = sorted(
                 video['video_files'],
@@ -121,7 +203,8 @@ async def crear_video_profesional(prompt, custom_script, voz_index, musica=None)
         # 6. Calcular duración por clip
         duracion_por_clip = duracion_total / len(clips)
-        # 7. Procesar clips de video
         clips_procesados = []
         for clip in clips:
             # Si el clip es más corto que la duración asignada, hacer loop
@@ -135,7 +218,8 @@ async def crear_video_profesional(prompt, custom_script, voz_index, musica=None)
         # 8. Combinar videos
         video_final = concatenate_videoclips(clips_procesados)
-        # 9. Procesar música
         if musica:
             musica_clip = AudioFileClip(musica.name)
             if musica_clip.duration < duracion_total:
@@ -146,16 +230,16 @@ async def crear_video_profesional(prompt, custom_script, voz_index, musica=None)
         video_final = video_final.set_audio(audio)
-        # 10. Exportar video
         output_path = f"video_{datetime.now().strftime('%Y%m%d_%H%M%S')}.mp4"
         video_final.write_videofile(
             output_path,
             codec="libx264",
             audio_codec="aac",
-            threads=4,
-            preset='ultrafast',
-            fps=24,
-            logger=None
         )
         return output_path
@@ -165,60 +249,61 @@ async def crear_video_profesional(prompt, custom_script, voz_index, musica=None)
         return None
     finally:
         # Limpieza de archivos temporales
-        if 'voz_archivo' in locals() and os.path.exists(voz_archivo):
             os.remove(voz_archivo)
-# Función para ejecutar la tarea asíncrona
-def run_async_task(prompt, custom_script, voz_index, musica=None):
-    return asyncio.run(crear_video_profesional(prompt, custom_script, voz_index, musica))
-# Interfaz profesional con solución para el problema de colas
-with gr.Blocks(theme=gr.themes.Soft(), title="Generador de Videos") as app:
     gr.Markdown("# 🎬 GENERADOR DE VIDEOS CON IA")
     with gr.Row():
         with gr.Column(scale=1):
-            gr.Markdown("### Configuración")
             prompt = gr.Textbox(label="Tema principal", placeholder="Ej: 'Los misterios de la antigua Grecia'")
             custom_script = gr.TextArea(
                 label="Guion personalizado (opcional)",
                 placeholder="Pega aquí tu propio guion completo...",
-                lines=6
             )
             voz = gr.Dropdown(
-                label="Voz",
                 choices=VOICE_NAMES,
                 value=VOICE_NAMES[0],
                 type="index"
             )
-            musica = gr.File(label="Música de fondo (opcional)", file_types=["audio"])
-            btn = gr.Button("🚀 Generar Video", variant="primary")
         with gr.Column(scale=2):
-            output = gr.Video(label="Video Resultante", format="mp4")
             gr.Examples(
                 examples=[
                     ["Los secretos de las pirámides egipcias", "", 5, None],
-                    ["La inteligencia artificial en medicina", "", 3, None]
                 ],
                 inputs=[prompt, custom_script, voz, musica],
-                label="Ejemplos"
             )
-    # SOLUCIÓN CORRECTA: Configuración de colas
     btn.click(
-        fn=run_async_task,
         inputs=[prompt, custom_script, voz, musica],
-        outputs=output,
-        concurrency_limit=1  # Limitar a 1 proceso concurrente
     )
 if __name__ == "__main__":
-    # Configuración correcta de colas
-    app.queue(concurrency_count=1, max_size=3)  # Configuración segura para colas
-    app.launch(
-        server_name="0.0.0.0",
-        server_port=7860
-    )

 import numpy as np
 from sklearn.feature_extraction.text import TfidfVectorizer
 import nltk
+import random
 from transformers import pipeline
 import torch
+import asyncio  # ¡Importación crítica que faltaba!
 # Configuración inicial
 nltk.download('punkt', quiet=True)
 # Configuración de modelos
 PEXELS_API_KEY = os.getenv("PEXELS_API_KEY")
+MODEL_NAME = "DeepESP/gpt2-spanish"  # Modelo en español más ligero
 # Lista de voces disponibles
+VOICES = asyncio.run(edge_tts.list_voices())  # Ahora funciona correctamente
+VOICE_NAMES = [f"{v['Name']} ({v['Gender']}, {v['LocaleName']})" for v in VOICES]
 def generar_guion_profesional(prompt):
+    """Genera guiones detallados con sistema de 3 niveles"""
+    try:
+        # 1. Intento con modelo principal
+        generator = pipeline(
+            "text-generation",
+            model=MODEL_NAME,
+            device=0 if torch.cuda.is_available() else -1
+        )
+        response = generator(
+            f"Escribe un guion profesional para un video de YouTube sobre '{prompt}'. "
+            "La estructura debe incluir:\n"
+            "1. Introducción atractiva\n"
+            "2. Tres secciones detalladas con subtítulos\n"
+            "3. Conclusión impactante\n"
+            "Usa un estilo natural para narración:",
+            max_length=1000,
+            temperature=0.7,
+            top_k=50,
+            top_p=0.95,
+            num_return_sequences=1
+        )
+        guion = response[0]['generated_text']
+        # 2. Verificar calidad del guion
+        if len(guion.split()) < 100:  # Si es muy corto
+            raise ValueError("Guion demasiado breve")
+        return guion
+    except Exception as e:
+        logger.error(f"Error generando guion: {str(e)}")
+        # 3. Respaldos inteligentes
+        temas = {
+            "historia": ["orígenes", "eventos clave", "impacto actual"],
+            "tecnología": ["funcionamiento", "aplicaciones", "futuro"],
+            "ciencia": ["teorías", "evidencia", "implicaciones"],
+            "misterio": ["enigma", "teorías", "explicaciones"],
+            "arte": ["orígenes", "características", "influencia"]
+        }
+        # Detectar categoría del tema
+        categoria = "general"
+        for key in temas:
+            if key in prompt.lower():
+                categoria = key
+                break
+        puntos_clave = temas.get(categoria, ["aspectos importantes", "datos relevantes", "conclusiones"])
+        # Generar guion de respaldo con estructura profesional
+        return f"""
+        ¡Hola a todos! Bienvenidos a este análisis completo sobre {prompt}.
+        En este video exploraremos a fondo este fascinante tema a través de tres secciones clave.
+        SECCIÓN 1: {puntos_clave[0].capitalize()}
+        Comenzaremos analizando los {puntos_clave[0]} fundamentales.
+        Esto nos permitirá entender mejor la base de {prompt}.
+        SECCIÓN 2: {puntos_clave[1].capitalize()}
+        En esta parte, examinaremos los {puntos_clave[1]} más relevantes
+        y cómo se relacionan con el tema principal.
+        SECCIÓN 3: {puntos_clave[2].capitalize()}
+        Finalmente, exploraremos las {puntos_clave[2]}
+        y qué significan para el futuro de este campo.
+        ¿Listos para profundizar? ¡Empecemos!
+        """
 def buscar_videos_avanzado(prompt, guion, num_videos=5):
     """Búsqueda inteligente de videos usando análisis de contenido"""
+    try:
+        # Dividir el guion en oraciones
+        oraciones = nltk.sent_tokenize(guion)
+        # Extraer palabras clave con TF-IDF
+        vectorizer = TfidfVectorizer(stop_words=['el', 'la', 'los', 'las', 'de', 'en', 'y', 'que'])
+        tfidf = vectorizer.fit_transform(oraciones)
+        palabras = vectorizer.get_feature_names_out()
+        scores = np.asarray(tfidf.sum(axis=0)).ravel()
+        indices_importantes = np.argsort(scores)[-5:]
+        palabras_clave = [palabras[i] for i in indices_importantes]
+        # Mezclar palabras clave del prompt y del guion
+        palabras_prompt = re.findall(r'\b\w{4,}\b', prompt.lower())
+        todas_palabras = list(set(palabras_clave + palabras_prompt))[:5]
+        # Buscar en Pexels
+        headers = {"Authorization": PEXELS_API_KEY}
+        response = requests.get(
+            f"https://api.pexels.com/videos/search?query={'+'.join(todas_palabras)}&per_page={num_videos}",
+            headers=headers,
+            timeout=15
+        )
+        videos = response.json().get('videos', [])
+        logger.info(f"Palabras clave usadas: {todas_palabras}")
+        # Seleccionar videos de mejor calidad
+        videos_ordenados = sorted(
+            videos,
+            key=lambda x: x.get('width', 0) * x.get('height', 0),
+            reverse=True
+        )
+        return videos_ordenados[:num_videos]
+    except Exception as e:
+        logger.error(f"Error en búsqueda de videos: {str(e)}")
+        # Búsqueda simple de respaldo
+        response = requests.get(
+            f"https://api.pexels.com/videos/search?query={prompt}&per_page={num_videos}",
+            headers={"Authorization": PEXELS_API_KEY},
+            timeout=10
+        )
+        return response.json().get('videos', [])[:num_videos]
+async def crear_video_profesional(prompt, custom_script, voz_index, musica=None, progress=gr.Progress()):
+    """SOLUCIÓN: Añadido parámetro progress para mantener la conexión activa"""
     try:
+        # 1. Generar o usar guion (con progreso)
+        progress(0.1, desc="Generando guion...")
         guion = custom_script if custom_script else generar_guion_profesional(prompt)
+        logger.info(f"Guion generado ({len(guion.split())} palabras)")
         # 2. Seleccionar voz
         voz_seleccionada = VOICES[voz_index]['ShortName']
+        # 3. Generar voz (con progreso)
+        progress(0.3, desc="Generando voz...")
         voz_archivo = "voz.mp3"
         await edge_tts.Communicate(guion, voz_seleccionada).save(voz_archivo)
         audio = AudioFileClip(voz_archivo)
         duracion_total = audio.duration
+        # 4. Buscar videos relevantes (con progreso)
+        progress(0.4, desc="Buscando videos...")
         videos_data = buscar_videos_avanzado(prompt, guion)
+        if not videos_data:
+            raise Exception("No se encontraron videos relevantes")
+        # 5. Descargar y preparar videos (con progreso)
         clips = []
+        total_videos = len(videos_data)
+        for i, video in enumerate(videos_data):
+            progress(0.5 + (i * 0.4 / total_videos), desc=f"Descargando video {i+1}/{total_videos}...")
             # Seleccionar la mejor calidad de video
             video_files = sorted(
                 video['video_files'],
         # 6. Calcular duración por clip
         duracion_por_clip = duracion_total / len(clips)
+        # 7. Procesar clips de video (con progreso)
+        progress(0.8, desc="Procesando videos...")
         clips_procesados = []
         for clip in clips:
             # Si el clip es más corto que la duración asignada, hacer loop
         # 8. Combinar videos
         video_final = concatenate_videoclips(clips_procesados)
+        # 9. Procesar música (con progreso)
+        progress(0.9, desc="Añadiendo música...")
         if musica:
             musica_clip = AudioFileClip(musica.name)
             if musica_clip.duration < duracion_total:
         video_final = video_final.set_audio(audio)
+        # 10. Exportar video (con progreso)
+        progress(0.95, desc="Exportando video final...")
         output_path = f"video_{datetime.now().strftime('%Y%m%d_%H%M%S')}.mp4"
         video_final.write_videofile(
             output_path,
             codec="libx264",
             audio_codec="aac",
+            threads=2,
+            preset='fast',
+            fps=24
         )
         return output_path
         return None
     finally:
         # Limpieza de archivos temporales
+        if os.path.exists(voz_archivo):
             os.remove(voz_archivo)
+def run_async_func(prompt, custom_script, voz_index, musica=None, progress=gr.Progress()):
+    """SOLUCIÓN: Añadido parámetro progress para mantener la conexión activa"""
+    return asyncio.run(crear_video_profesional(prompt, custom_script, voz_index, musica, progress))
+# Interfaz profesional
+with gr.Blocks(theme=gr.themes.Soft(), title="Generador de Videos Profesional") as app:
     gr.Markdown("# 🎬 GENERADOR DE VIDEOS CON IA")
     with gr.Row():
         with gr.Column(scale=1):
+            gr.Markdown("### Configuración del Contenido")
             prompt = gr.Textbox(label="Tema principal", placeholder="Ej: 'Los misterios de la antigua Grecia'")
             custom_script = gr.TextArea(
                 label="Guion personalizado (opcional)",
                 placeholder="Pega aquí tu propio guion completo...",
+                lines=8
             )
             voz = gr.Dropdown(
+                label="Selecciona una voz",
                 choices=VOICE_NAMES,
                 value=VOICE_NAMES[0],
                 type="index"
             )
+            musica = gr.File(
+                label="Música de fondo (opcional)",
+                file_types=["audio"]
+            )
+            btn = gr.Button("🚀 Generar Video", variant="primary", size="lg")
         with gr.Column(scale=2):
+            output = gr.Video(
+                label="Video Resultante",
+                format="mp4",
+                interactive=False
+            )
             gr.Examples(
                 examples=[
                     ["Los secretos de las pirámides egipcias", "", 5, None],
+                    ["La inteligencia artificial en medicina", "", 3, None],
+                    ["Lugares abandonados más misteriosos", "", 8, None]
                 ],
                 inputs=[prompt, custom_script, voz, musica],
+                label="Ejemplos: Haz clic en uno y luego en Generar"
             )
+    # SOLUCIÓN: Añadido parámetro progress para mantener la conexión activa
     btn.click(
+        fn=run_async_func,
         inputs=[prompt, custom_script, voz, musica],
+        outputs=output
     )
 if __name__ == "__main__":
+    app.launch(server_name="0.0.0.0", server_port=7860)