Spaces:

gnosticdev
/

videos-maker-ai-youtuber

Sleeping

File size: 8,081 Bytes

1f72b0c
 
b808439
1088ad0
 
02e97a3
 
c7d476a
1f72b0c
 
1088ad0
beea2cf
17d6357
1088ad0
1f72b0c
17d6357
1088ad0
 
1f72b0c
 
 
c7d476a
1f72b0c
17d6357
1088ad0
1f72b0c
1088ad0
c7d476a
1f72b0c
02e97a3
17d6357
02e97a3
 
 
 
c7d476a
02e97a3
 
 
 
f8ec5f8
17d6357
f8ec5f8
 
615a9e3
f8ec5f8
615a9e3
f8ec5f8
17d6357
 
02e97a3
1088ad0
d446056
4123c9b
17d6357
 
 
 
 
 
f8ec5f8
17d6357
 
 
d446056
17d6357
d446056
4123c9b
d446056
4123c9b
f8ec5f8
1088ad0
17d6357
 
 
 
d446056
17d6357
1088ad0
4123c9b
17d6357
 
 
 
f8ec5f8
1088ad0
4123c9b
f8ec5f8
 
 
02e97a3
 
 
c7d476a
f8ec5f8
 
1f72b0c
 
17d6357
beea2cf
f8ec5f8
c7d476a
 
 
 
1f72b0c
c7d476a
beea2cf
c7d476a
 
 
f8ec5f8
c7d476a
 
 
 
 
beea2cf
c7d476a
 
1f72b0c
1088ad0
beea2cf
17d6357
c7d476a
f8ec5f8
c7d476a
17d6357
c7d476a
 
 
 
 
4123c9b
 
c7d476a
17d6357
beea2cf
17d6357
 
 
beea2cf
 
1088ad0
c7d476a
4123c9b
17d6357
 
 
 
 
 
 
 
57af5e5
17d6357
f8ec5f8
 
17d6357
 
 
 
 
f8ec5f8
17d6357
c7d476a
17d6357
ced4e6e
 
 
 
 
c7d476a
4123c9b
 
ced4e6e
c7d476a
 
beea2cf
f8ec5f8
beea2cf
1f72b0c
17d6357
1f72b0c
c7d476a
1088ad0
1f72b0c
d446056
1088ad0
 
 
d446056
1088ad0
1f72b0c
c7d476a
ee5aeee
 
1f72b0c
1088ad0
c7d476a
1088ad0
 
1f72b0c
 
c7d476a
1f72b0c
 
1088ad0
 
c7d476a
1088ad0
1f72b0c
d446056
 
4123c9b
d446056
 
 
 
1f72b0c
 
4123c9b
1f72b0c

import math
import tempfile
import logging
import os
import asyncio
import time
from threading import Timer
from moviepy.editor import *
import edge_tts
import gradio as gr
from pydub import AudioSegment

# Configuración de Logs
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

# CONSTANTES DE ARCHIVOS
INTRO_VIDEO = "introvideo.mp4"
OUTRO_VIDEO = "outrovideo.mp4"
MUSIC_BG = "musicafondo.mp3"
FX_SOUND = "fxsound.mp3"
WATERMARK = "watermark.png"
EJEMPLO_VIDEO = "ejemplo.mp4"

# Validar existencia de archivos
for file in [INTRO_VIDEO, OUTRO_VIDEO, MUSIC_BG, FX_SOUND, WATERMARK, EJEMPLO_VIDEO]:
    if not os.path.exists(file):
        logging.error(f"Falta archivo necesario: {file}")
        raise FileNotFoundError(f"Falta: {file}")

def eliminar_archivo_tiempo(ruta, delay=1800):
    """Elimina archivos temporales después de 30 minutos"""
    def eliminar():
        try:
            if os.path.exists(ruta):
                os.remove(ruta)
                logging.info(f"Archivo eliminado: {ruta}")
        except Exception as e:
            logging.error(f"Error al eliminar {ruta}: {e}")
    Timer(delay, eliminar).start()

def validar_texto(texto):
    """Valida el texto para evitar errores en TTS"""
    texto_limpio = texto.strip()
    if len(texto_limpio) < 3:
        raise gr.Error("⚠️ El texto debe tener al menos 3 caracteres")
    if any(c in texto_limpio for c in ["|", "\n", "\r"]):
        raise gr.Error("⚠️ Caracteres no permitidos detectados")

async def procesar_audio(texto, voz, duracion_total, duracion_intro, max_tts_time):
    """Genera y mezcla audio con protección de duración"""
    temp_files = []
    try:
        validar_texto(texto)
        
        # Generar TTS
        communicate = edge_tts.Communicate(texto, voz)
        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_tts:
            await communicate.save(tmp_tts.name)
            tts_audio = AudioFileClip(tmp_tts.name)
            temp_files.append(tmp_tts.name)
            
            # Asegurar TTS no exceda el tiempo disponible
            if tts_audio.duration > max_tts_time:
                tts_audio = tts_audio.subclip(0, max_tts_time)

        # Procesar música de fondo
        bg_music = AudioSegment.from_mp3(MUSIC_BG)
        needed_ms = int(duracion_total * 1000)
        repeticiones = needed_ms // len(bg_music) + 1
        bg_music = bg_music * repeticiones
        bg_music = bg_music[:needed_ms].fade_out(5000)
        
        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_bg:
            bg_music.export(tmp_bg.name, format="mp3")
            bg_audio = AudioFileClip(tmp_bg.name).volumex(0.15)
            temp_files.append(tmp_bg.name)

        # Combinar audios con duraciones exactas
        audio_final = CompositeAudioClip([
            bg_audio.set_duration(duracion_total),
            tts_audio.volumex(0.85)
                   .set_start(duracion_intro)
                   .set_duration(max_tts_time)
        ]).set_duration(duracion_total)
        
        return audio_final
    
    except Exception as e:
        logging.error(f" fallo en audio: {str(e)}")
        raise
    finally:
        for file in temp_files:
            try:
                os.remove(file)
            except Exception as e:
                logging.warning(f"Error limpiando {file}: {e}")

def agregar_transiciones(clips):
    """Agrega transiciones visuales cada 40 segundos"""
    try:
        fx_audio = AudioFileClip(FX_SOUND).subclip(0, 0.5)
        watermark = (ImageClip(WATERMARK)
                    .set_duration(0.5)
                    .resize(height=50)
                    .set_pos(("right", "bottom")))
        
        clips_finales = []
        for i, clip in enumerate(clips):
            clip_watermarked = CompositeVideoClip([clip, watermark])
            
            if i > 0 and i % 40 == 0:
                transicion = CompositeVideoClip([watermark.set_duration(0.5)]).set_audio(fx_audio)
                clips_finales.append(transicion)
            
            clips_finales.append(clip_watermarked)
        
        return concatenate_videoclips(clips_finales, method="compose")
    except Exception as e:
        logging.error(f"Error en transiciones: {e}")
        return concatenate_videoclips(clips)

async def procesar_video(video_input, texto_tts, voz_seleccionada, metodo_corte, duracion_corte):
    try:
        # Cargar video original
        video_original = VideoFileClip(video_input)
        audio_original = video_original.audio.volumex(0.7) if video_original.audio else None
        
        # Cortar video según método
        clips = []
        if metodo_corte == "manual":
            for i in range(math.ceil(video_original.duration / duracion_corte)):
                clips.append(video_original.subclip(i*duracion_corte, (i+1)*duracion_corte))
        else:
            clips = [video_original.subclip(i, min(i+40, video_original.duration)) 
                    for i in range(0, math.ceil(video_original.duration), 40)]
        
        # Procesar transiciones visuales
        video_editado = agregar_transiciones(clips)
        video_editado_duration = video_editado.duration
        
        # Combinar con intro/outro
        intro = VideoFileClip(INTRO_VIDEO)
        outro = VideoFileClip(OUTRO_VIDEO)
        video_final = concatenate_videoclips([intro, video_editado, outro])
        duracion_total = video_final.duration
        
        # Procesar audio (recibe duración exacta para TTS)
        audio_tts_bg = await procesar_audio(
            texto_tts,
            voz_seleccionada,
            duracion_total,
            intro.duration,
            video_editado_duration
        )
        
        # Combinar todos los audios
        audios = [audio_tts_bg]
        if audio_original:
            audios.append(
                audio_original
                .set_duration(video_editado_duration)
                .set_start(intro.duration)
            )
        
        audio_final = CompositeAudioClip(audios).set_duration(duracion_total)
        
        # Renderizar video final
        with tempfile.NamedTemporaryFile(suffix=".mp4", delete=False) as tmp:
            video_final.set_audio(audio_final).write_videofile(
                tmp.name,
                codec="libx264",
                audio_codec="aac",
                fps=24,
                threads=4,
                verbose=False
            )
            eliminar_archivo_tiempo(tmp.name)
            return tmp.name
    except Exception as e:
        logging.error(f" fallo general: {str(e)}")
        raise

# Interfaz Gradio
with gr.Blocks() as demo:
    gr.Markdown("# Editor de Video con IA")
    
    with gr.Tab("Principal"):
        video_input = gr.Video(label="Subir video")
        texto_tts = gr.Textbox(
            label="Texto para TTS",
            lines=3,
            placeholder="Escribe aquí tu texto..."
        )
        voz_seleccionada = gr.Dropdown(
            label="Voz",
            choices=["es-ES-AlvaroNeural", "es-MX-BeatrizNeural"],
            value="es-ES-AlvaroNeural"
        )
        procesar_btn = gr.Button("Generar Video")
        video_output = gr.Video(label="Video Procesado")
    
    with gr.Tab("Ajustes"):
        metodo_corte = gr.Radio(
            ["inteligente", "manual"],
            label="Método de corte",
            value="inteligente"
        )
        duracion_corte = gr.Slider(
            1, 60, 10,
            label="Segundos por corte (manual)"
        )

    with gr.Accordion("Ejemplos de Uso", open=False):
        gr.Examples(
            examples=[[EJEMPLO_VIDEO, "¡Hola! Esto es una prueba. Suscríbete al canal y activa la campanita."]],
            inputs=[video_input, texto_tts],
            label="Ejemplos"
        )

    procesar_btn.click(
        procesar_video,
        inputs=[video_input, texto_tts, voz_seleccionada, metodo_corte, duracion_corte],
        outputs=video_output
    )

if __name__ == "__main__":
    demo.queue().launch()