Spaces:

gnosticdev
/

videos-maker-ai-youtuber

Sleeping

File size: 7,754 Bytes

1f72b0c
 
b808439
1088ad0
 
c7d476a
1f72b0c
 
0f64582
beea2cf
17d6357
1088ad0
1f72b0c
17d6357
1088ad0
 
0f64582
1f72b0c
 
c7d476a
1f72b0c
17d6357
0f64582
1f72b0c
1088ad0
c7d476a
1f72b0c
02e97a3
17d6357
02e97a3
 
 
 
c7d476a
02e97a3
 
 
 
f8ec5f8
17d6357
f8ec5f8
 
615a9e3
f8ec5f8
615a9e3
f8ec5f8
617df9d
 
02e97a3
1088ad0
d446056
4123c9b
17d6357
 
 
 
 
 
f8ec5f8
617df9d
 
 
d446056
617df9d
4123c9b
f8ec5f8
 
 
02e97a3
 
 
c7d476a
f8ec5f8
 
1f72b0c
 
17d6357
beea2cf
f8ec5f8
c7d476a
 
 
 
1f72b0c
c7d476a
beea2cf
c7d476a
 
 
f8ec5f8
c7d476a
 
 
 
 
beea2cf
c7d476a
 
1f72b0c
1088ad0
beea2cf
17d6357
c7d476a
f8ec5f8
c7d476a
17d6357
c7d476a
 
 
 
 
4123c9b
 
c7d476a
17d6357
beea2cf
17d6357
 
 
beea2cf
 
0f64582
 
 
 
 
 
 
 
 
 
 
4123c9b
617df9d
 
 
 
 
57af5e5
0f64582
 
f8ec5f8
0f64582
 
f8ec5f8
0f64582
 
 
 
 
 
c7d476a
17d6357
ced4e6e
0f64582
ced4e6e
 
 
c7d476a
4123c9b
 
ced4e6e
c7d476a
 
beea2cf
f8ec5f8
beea2cf
1f72b0c
17d6357
1f72b0c
c7d476a
1088ad0
1f72b0c
d446056
1088ad0
 
 
d446056
1088ad0
1f72b0c
c7d476a
ee5aeee
 
1f72b0c
1088ad0
c7d476a
1088ad0
 
1f72b0c
 
c7d476a
1f72b0c
 
1088ad0
 
c7d476a
1088ad0
1f72b0c
d446056
 
4123c9b
d446056
 
 
 
1f72b0c
 
4123c9b
1f72b0c

import math
import tempfile
import logging
import os
import asyncio
from moviepy.editor import *
import edge_tts
import gradio as gr
from pydub import AudioSegment

# Configuración de Logs
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

# CONSTANTES DE ARCHIVOS
INTRO_VIDEO = "introvideo.mp4"
OUTRO_VIDEO = "outrovideo.mp4"
MUSIC_BG = "musicafondo.mp3"
FX_SOUND = "fxsound.mp3"
WATERMARK = "watermark.png"
EJEMPLO_VIDEO = "ejemplo.mp4"

# Validar existencia de archivos
for file in [INTRO_VIDEO, OUTRO_VIDEO, MUSIC_BG, FX_SOUND, WATERMARK, EJEMPLO_VIDEO]:
    if not os.path.exists(file):
        logging.error(f"Falta archivo necesario: {file}")
        raise FileNotFoundError(f"Falta: {file}")

def eliminar_archivo_tiempo(ruta, delay=1800):
    """Elimina archivos temporales después de 30 minutos"""
    def eliminar():
        try:
            if os.path.exists(ruta):
                os.remove(ruta)
                logging.info(f"Archivo eliminado: {ruta}")
        except Exception as e:
            logging.error(f"Error al eliminar {ruta}: {e}")
    Timer(delay, eliminar).start()

def validar_texto(texto):
    """Valida el texto para evitar errores en TTS"""
    texto_limpio = texto.strip()
    if len(texto_limpio) < 3:
        raise gr.Error("⚠️ El texto debe tener al menos 3 caracteres")
    if any(c in texto_limpio for c in ["|", "\n", "\r"]):
        raise gr.Error("⚠️ Caracteres no permitidos detectados")

async def procesar_audio(texto, voz, duracion_maxima):
    """Genera TTS y lo limita a la duración máxima disponible"""
    temp_files = []
    try:
        validar_texto(texto)
        
        # Generar TTS
        communicate = edge_tts.Communicate(texto, voz)
        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_tts:
            await communicate.save(tmp_tts.name)
            tts_audio = AudioFileClip(tmp_tts.name)
            temp_files.append(tmp_tts.name)
            
            # Limitar TTS a la duración máxima
            if tts_audio.duration > duracion_maxima:
                tts_audio = tts_audio.subclip(0, duracion_maxima)

        return tts_audio
    
    except Exception as e:
        logging.error(f" fallo en audio: {str(e)}")
        raise
    finally:
        for file in temp_files:
            try:
                os.remove(file)
            except Exception as e:
                logging.warning(f"Error limpiando {file}: {e}")

def agregar_transiciones(clips):
    """Agrega transiciones visuales cada 40 segundos"""
    try:
        fx_audio = AudioFileClip(FX_SOUND).subclip(0, 0.5)
        watermark = (ImageClip(WATERMARK)
                    .set_duration(0.5)
                    .resize(height=50)
                    .set_pos(("right", "bottom")))
        
        clips_finales = []
        for i, clip in enumerate(clips):
            clip_watermarked = CompositeVideoClip([clip, watermark])
            
            if i > 0 and i % 40 == 0:
                transicion = CompositeVideoClip([watermark.set_duration(0.5)]).set_audio(fx_audio)
                clips_finales.append(transicion)
            
            clips_finales.append(clip_watermarked)
        
        return concatenate_videoclips(clips_finales, method="compose")
    except Exception as e:
        logging.error(f"Error en transiciones: {e}")
        return concatenate_videoclips(clips)

async def procesar_video(video_input, texto_tts, voz_seleccionada, metodo_corte, duracion_corte):
    try:
        # Cargar video original
        video_original = VideoFileClip(video_input)
        audio_original = video_original.audio.volumex(0.7) if video_original.audio else None
        
        # Cortar video según método
        clips = []
        if metodo_corte == "manual":
            for i in range(math.ceil(video_original.duration / duracion_corte)):
                clips.append(video_original.subclip(i*duracion_corte, (i+1)*duracion_corte))
        else:
            clips = [video_original.subclip(i, min(i+40, video_original.duration)) 
                    for i in range(0, math.ceil(video_original.duration), 40)]
        
        # Procesar transiciones visuales
        video_editado = agregar_transiciones(clips)
        video_editado_duration = video_editado.duration
        
        # Combinar con intro/outro
        intro = VideoFileClip(INTRO_VIDEO)
        outro = VideoFileClip(OUTRO_VIDEO)
        
        # Música de fondo solo para el video editado
        bg_music = AudioSegment.from_mp3(MUSIC_BG)
        needed_ms = int(video_editado_duration * 1000)
        repeticiones = needed_ms // len(bg_music) + 1
        bg_music = bg_music * repeticiones
        bg_music = bg_music[:needed_ms].fade_out(5000)
        
        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_bg:
            bg_music.export(tmp_bg.name, format="mp3")
            bg_audio = AudioFileClip(tmp_bg.name).volumex(0.15)
        
        # Duración máxima para el TTS (después de la intro)
        max_tts_time = video_editado_duration
        
        # Procesar TTS
        tts_audio = await procesar_audio(texto_tts, voz_seleccionada, max_tts_time)
        
        # Combinar audios para el video editado
        audios_editado = [bg_audio]
        if audio_original:
            audios_editado.append(audio_original.set_duration(video_editado_duration))
        audios_editado.append(tts_audio.set_start(0))
        
        audio_editado = CompositeAudioClip(audios_editado).set_duration(video_editado_duration)
        video_editado = video_editado.set_audio(audio_editado)
        
        # Concatenar intro, video editado y outro
        video_final = concatenate_videoclips([intro, video_editado, outro])
        duracion_total = video_final.duration
        
        # Renderizar video final
        with tempfile.NamedTemporaryFile(suffix=".mp4", delete=False) as tmp:
            video_final.write_videofile(
                tmp.name,
                codec="libx264",
                audio_codec="aac",
                fps=24,
                threads=4,
                verbose=False
            )
            eliminar_archivo_tiempo(tmp.name)
            return tmp.name
    except Exception as e:
        logging.error(f" fallo general: {str(e)}")
        raise

# Interfaz Gradio
with gr.Blocks() as demo:
    gr.Markdown("# Editor de Video con IA")
    
    with gr.Tab("Principal"):
        video_input = gr.Video(label="Subir video")
        texto_tts = gr.Textbox(
            label="Texto para TTS",
            lines=3,
            placeholder="Escribe aquí tu texto..."
        )
        voz_seleccionada = gr.Dropdown(
            label="Voz",
            choices=["es-ES-AlvaroNeural", "es-MX-BeatrizNeural"],
            value="es-ES-AlvaroNeural"
        )
        procesar_btn = gr.Button("Generar Video")
        video_output = gr.Video(label="Video Procesado")
    
    with gr.Tab("Ajustes"):
        metodo_corte = gr.Radio(
            ["inteligente", "manual"],
            label="Método de corte",
            value="inteligente"
        )
        duracion_corte = gr.Slider(
            1, 60, 10,
            label="Segundos por corte (manual)"
        )

    with gr.Accordion("Ejemplos de Uso", open=False):
        gr.Examples(
            examples=[[EJEMPLO_VIDEO, "¡Hola! Esto es una prueba. Suscríbete al canal y activa la campanita."]],
            inputs=[video_input, texto_tts],
            label="Ejemplos"
        )

    procesar_btn.click(
        procesar_video,
        inputs=[video_input, texto_tts, voz_seleccionada, metodo_corte, duracion_corte],
        outputs=video_output
    )

if __name__ == "__main__":
    demo.queue().launch()