INVIDEO_BASIC / app.py
gnosticdev's picture
Update app.py
7c87717 verified
raw
history blame
5.42 kB
import os
import subprocess
import requests
import gradio as gr
from moviepy.editor import *
from datetime import datetime
import logging
import re
import torch
from transformers import GPT2LMHeadModel, GPT2Tokenizer
# Configuración básica
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)
# Configuración de entorno (usa tu propia API key de Pexels)
PEXELS_API_KEY = os.getenv("PEXELS_API_KEY") or "TU_API_KEY_AQUI"
# Voces disponibles (Edge-TTS)
VOICES = ["es-MX-DaliaNeural", "es-ES-ElviraNeural", "en-US-JennyNeural"]
# Carga el modelo GPT-2 en español (ligero y rápido)
tokenizer = GPT2Tokenizer.from_pretrained("datificate/gpt2-small-spanish")
model = GPT2LMHeadModel.from_pretrained("datificate/gpt2-small-spanish")
def generar_texto(tema):
"""Genera un texto largo y natural sobre el tema (sin estructuras forzadas)."""
try:
prompt = f"Habla extensamente sobre {tema} en un tono natural y detallado:"
inputs = tokenizer(prompt, return_tensors="pt", truncation=True, max_length=512)
outputs = model.generate(
inputs.input_ids,
max_length=800,
do_sample=True,
temperature=0.7,
top_k=50,
pad_token_id=tokenizer.eos_token_id
)
texto = tokenizer.decode(outputs[0], skip_special_tokens=True)
return re.sub(r'\s+', ' ', texto).strip()
except Exception as e:
logger.error(f"Error generando texto: {e}")
return f"Contenido generado sobre {tema}."
def buscar_videos(tema):
"""Busca videos en Pexels y devuelve los 3 más relevantes."""
try:
headers = {"Authorization": PEXELS_API_KEY}
response = requests.get(
f"https://api.pexels.com/videos/search?query={tema}&per_page=3",
headers=headers,
timeout=10
)
return response.json().get("videos", [])[:3]
except Exception as e:
logger.error(f"Error buscando videos: {e}")
return []
def crear_video(tema, voz_seleccionada):
"""Genera el video final con voz y clips de video."""
try:
# 1. Generar texto
texto = generar_texto(tema)
# 2. Convertir texto a voz (Edge-TTS)
voz_archivo = "narracion.mp3"
subprocess.run([
'edge-tts',
'--voice', voz_seleccionada,
'--text', texto,
'--write-media', voz_archivo
], check=True)
# 3. Procesar audio
audio = AudioFileClip(voz_archivo)
duracion_total = audio.duration
# 4. Buscar y descargar videos
videos = buscar_videos(tema) or buscar_videos("nature")
clips = []
for i, video in enumerate(videos[:3]): # Máximo 3 videos
try:
mejor_calidad = max(video['video_files'], key=lambda x: x.get('width', 0))
url_video = mejor_calidad['link']
# Descargar video temporal
temp_file = f"temp_video_{i}.mp4"
with requests.get(url_video, stream=True) as r:
r.raise_for_status()
with open(temp_file, 'wb') as f:
for chunk in r.iter_content(chunk_size=8192):
f.write(chunk)
# Ajustar duración del clip
clip = VideoFileClip(temp_file)
duracion_clip = min(duracion_total / len(videos), clip.duration)
clips.append(clip.subclip(0, duracion_clip))
except Exception as e:
logger.error(f"Error procesando video {i}: {e}")
# 5. Combinar clips (o usar fondo negro si no hay videos)
if not clips:
video_final = ColorClip((1280, 720), (0, 0, 0), duration=duracion_total)
else:
video_final = concatenate_videoclips(clips, method="compose")
video_final = video_final.set_audio(audio)
# 6. Exportar video
nombre_archivo = f"video_final_{datetime.now().strftime('%Y%m%d_%H%M%S')}.mp4"
video_final.write_videofile(
nombre_archivo,
fps=24,
codec="libx264",
audio_codec="aac",
threads=2,
preset='fast'
)
return nombre_archivo
except Exception as e:
logger.error(f"Error crítico: {e}")
return None
finally:
# Limpieza de archivos temporales
if os.path.exists(voz_archivo):
os.remove(voz_archivo)
for i in range(3):
temp_file = f"temp_video_{i}.mp4"
if os.path.exists(temp_file):
os.remove(temp_file)
# Interfaz de Gradio (sencilla y funcional)
with gr.Blocks() as app:
gr.Markdown("# 🎬 Generador Automático de Videos")
with gr.Row():
tema = gr.Textbox(label="Tema del video", placeholder="Ej: 'Historia de la inteligencia artificial'")
voz = gr.Dropdown(label="Voz", choices=VOICES, value=VOICES[0])
btn = gr.Button("Generar Video", variant="primary")
salida = gr.Video(label="Resultado")
btn.click(
fn=crear_video,
inputs=[tema, voz],
outputs=salida
)
if __name__ == "__main__":
app.launch(server_name="0.0.0.0", server_port=7860)