File size: 8,081 Bytes
1f72b0c
 
b808439
1088ad0
 
02e97a3
 
c7d476a
1f72b0c
 
1088ad0
beea2cf
17d6357
1088ad0
1f72b0c
17d6357
1088ad0
 
1f72b0c
 
 
c7d476a
1f72b0c
17d6357
1088ad0
1f72b0c
1088ad0
c7d476a
1f72b0c
02e97a3
17d6357
02e97a3
 
 
 
c7d476a
02e97a3
 
 
 
f8ec5f8
17d6357
f8ec5f8
 
615a9e3
f8ec5f8
615a9e3
f8ec5f8
17d6357
 
02e97a3
1088ad0
d446056
4123c9b
17d6357
 
 
 
 
 
f8ec5f8
17d6357
 
 
d446056
17d6357
d446056
4123c9b
d446056
4123c9b
f8ec5f8
1088ad0
17d6357
 
 
 
d446056
17d6357
1088ad0
4123c9b
17d6357
 
 
 
f8ec5f8
1088ad0
4123c9b
f8ec5f8
 
 
02e97a3
 
 
c7d476a
f8ec5f8
 
1f72b0c
 
17d6357
beea2cf
f8ec5f8
c7d476a
 
 
 
1f72b0c
c7d476a
beea2cf
c7d476a
 
 
f8ec5f8
c7d476a
 
 
 
 
beea2cf
c7d476a
 
1f72b0c
1088ad0
beea2cf
17d6357
c7d476a
f8ec5f8
c7d476a
17d6357
c7d476a
 
 
 
 
4123c9b
 
c7d476a
17d6357
beea2cf
17d6357
 
 
beea2cf
 
1088ad0
c7d476a
4123c9b
17d6357
 
 
 
 
 
 
 
57af5e5
17d6357
f8ec5f8
 
17d6357
 
 
 
 
f8ec5f8
17d6357
c7d476a
17d6357
ced4e6e
 
 
 
 
c7d476a
4123c9b
 
ced4e6e
c7d476a
 
beea2cf
f8ec5f8
beea2cf
1f72b0c
17d6357
1f72b0c
c7d476a
1088ad0
1f72b0c
d446056
1088ad0
 
 
d446056
1088ad0
1f72b0c
c7d476a
ee5aeee
 
1f72b0c
1088ad0
c7d476a
1088ad0
 
1f72b0c
 
c7d476a
1f72b0c
 
1088ad0
 
c7d476a
1088ad0
1f72b0c
d446056
 
4123c9b
d446056
 
 
 
1f72b0c
 
4123c9b
1f72b0c
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
import math
import tempfile
import logging
import os
import asyncio
import time
from threading import Timer
from moviepy.editor import *
import edge_tts
import gradio as gr
from pydub import AudioSegment

# Configuración de Logs
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

# CONSTANTES DE ARCHIVOS
INTRO_VIDEO = "introvideo.mp4"
OUTRO_VIDEO = "outrovideo.mp4"
MUSIC_BG = "musicafondo.mp3"
FX_SOUND = "fxsound.mp3"
WATERMARK = "watermark.png"
EJEMPLO_VIDEO = "ejemplo.mp4"

# Validar existencia de archivos
for file in [INTRO_VIDEO, OUTRO_VIDEO, MUSIC_BG, FX_SOUND, WATERMARK, EJEMPLO_VIDEO]:
    if not os.path.exists(file):
        logging.error(f"Falta archivo necesario: {file}")
        raise FileNotFoundError(f"Falta: {file}")

def eliminar_archivo_tiempo(ruta, delay=1800):
    """Elimina archivos temporales después de 30 minutos"""
    def eliminar():
        try:
            if os.path.exists(ruta):
                os.remove(ruta)
                logging.info(f"Archivo eliminado: {ruta}")
        except Exception as e:
            logging.error(f"Error al eliminar {ruta}: {e}")
    Timer(delay, eliminar).start()

def validar_texto(texto):
    """Valida el texto para evitar errores en TTS"""
    texto_limpio = texto.strip()
    if len(texto_limpio) < 3:
        raise gr.Error("⚠️ El texto debe tener al menos 3 caracteres")
    if any(c in texto_limpio for c in ["|", "\n", "\r"]):
        raise gr.Error("⚠️ Caracteres no permitidos detectados")

async def procesar_audio(texto, voz, duracion_total, duracion_intro, max_tts_time):
    """Genera y mezcla audio con protección de duración"""
    temp_files = []
    try:
        validar_texto(texto)
        
        # Generar TTS
        communicate = edge_tts.Communicate(texto, voz)
        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_tts:
            await communicate.save(tmp_tts.name)
            tts_audio = AudioFileClip(tmp_tts.name)
            temp_files.append(tmp_tts.name)
            
            # Asegurar TTS no exceda el tiempo disponible
            if tts_audio.duration > max_tts_time:
                tts_audio = tts_audio.subclip(0, max_tts_time)

        # Procesar música de fondo
        bg_music = AudioSegment.from_mp3(MUSIC_BG)
        needed_ms = int(duracion_total * 1000)
        repeticiones = needed_ms // len(bg_music) + 1
        bg_music = bg_music * repeticiones
        bg_music = bg_music[:needed_ms].fade_out(5000)
        
        with tempfile.NamedTemporaryFile(delete=False, suffix=".mp3") as tmp_bg:
            bg_music.export(tmp_bg.name, format="mp3")
            bg_audio = AudioFileClip(tmp_bg.name).volumex(0.15)
            temp_files.append(tmp_bg.name)

        # Combinar audios con duraciones exactas
        audio_final = CompositeAudioClip([
            bg_audio.set_duration(duracion_total),
            tts_audio.volumex(0.85)
                   .set_start(duracion_intro)
                   .set_duration(max_tts_time)
        ]).set_duration(duracion_total)
        
        return audio_final
    
    except Exception as e:
        logging.error(f" fallo en audio: {str(e)}")
        raise
    finally:
        for file in temp_files:
            try:
                os.remove(file)
            except Exception as e:
                logging.warning(f"Error limpiando {file}: {e}")

def agregar_transiciones(clips):
    """Agrega transiciones visuales cada 40 segundos"""
    try:
        fx_audio = AudioFileClip(FX_SOUND).subclip(0, 0.5)
        watermark = (ImageClip(WATERMARK)
                    .set_duration(0.5)
                    .resize(height=50)
                    .set_pos(("right", "bottom")))
        
        clips_finales = []
        for i, clip in enumerate(clips):
            clip_watermarked = CompositeVideoClip([clip, watermark])
            
            if i > 0 and i % 40 == 0:
                transicion = CompositeVideoClip([watermark.set_duration(0.5)]).set_audio(fx_audio)
                clips_finales.append(transicion)
            
            clips_finales.append(clip_watermarked)
        
        return concatenate_videoclips(clips_finales, method="compose")
    except Exception as e:
        logging.error(f"Error en transiciones: {e}")
        return concatenate_videoclips(clips)

async def procesar_video(video_input, texto_tts, voz_seleccionada, metodo_corte, duracion_corte):
    try:
        # Cargar video original
        video_original = VideoFileClip(video_input)
        audio_original = video_original.audio.volumex(0.7) if video_original.audio else None
        
        # Cortar video según método
        clips = []
        if metodo_corte == "manual":
            for i in range(math.ceil(video_original.duration / duracion_corte)):
                clips.append(video_original.subclip(i*duracion_corte, (i+1)*duracion_corte))
        else:
            clips = [video_original.subclip(i, min(i+40, video_original.duration)) 
                    for i in range(0, math.ceil(video_original.duration), 40)]
        
        # Procesar transiciones visuales
        video_editado = agregar_transiciones(clips)
        video_editado_duration = video_editado.duration
        
        # Combinar con intro/outro
        intro = VideoFileClip(INTRO_VIDEO)
        outro = VideoFileClip(OUTRO_VIDEO)
        video_final = concatenate_videoclips([intro, video_editado, outro])
        duracion_total = video_final.duration
        
        # Procesar audio (recibe duración exacta para TTS)
        audio_tts_bg = await procesar_audio(
            texto_tts,
            voz_seleccionada,
            duracion_total,
            intro.duration,
            video_editado_duration
        )
        
        # Combinar todos los audios
        audios = [audio_tts_bg]
        if audio_original:
            audios.append(
                audio_original
                .set_duration(video_editado_duration)
                .set_start(intro.duration)
            )
        
        audio_final = CompositeAudioClip(audios).set_duration(duracion_total)
        
        # Renderizar video final
        with tempfile.NamedTemporaryFile(suffix=".mp4", delete=False) as tmp:
            video_final.set_audio(audio_final).write_videofile(
                tmp.name,
                codec="libx264",
                audio_codec="aac",
                fps=24,
                threads=4,
                verbose=False
            )
            eliminar_archivo_tiempo(tmp.name)
            return tmp.name
    except Exception as e:
        logging.error(f" fallo general: {str(e)}")
        raise

# Interfaz Gradio
with gr.Blocks() as demo:
    gr.Markdown("# Editor de Video con IA")
    
    with gr.Tab("Principal"):
        video_input = gr.Video(label="Subir video")
        texto_tts = gr.Textbox(
            label="Texto para TTS",
            lines=3,
            placeholder="Escribe aquí tu texto..."
        )
        voz_seleccionada = gr.Dropdown(
            label="Voz",
            choices=["es-ES-AlvaroNeural", "es-MX-BeatrizNeural"],
            value="es-ES-AlvaroNeural"
        )
        procesar_btn = gr.Button("Generar Video")
        video_output = gr.Video(label="Video Procesado")
    
    with gr.Tab("Ajustes"):
        metodo_corte = gr.Radio(
            ["inteligente", "manual"],
            label="Método de corte",
            value="inteligente"
        )
        duracion_corte = gr.Slider(
            1, 60, 10,
            label="Segundos por corte (manual)"
        )

    with gr.Accordion("Ejemplos de Uso", open=False):
        gr.Examples(
            examples=[[EJEMPLO_VIDEO, "¡Hola! Esto es una prueba. Suscríbete al canal y activa la campanita."]],
            inputs=[video_input, texto_tts],
            label="Ejemplos"
        )

    procesar_btn.click(
        procesar_video,
        inputs=[video_input, texto_tts, voz_seleccionada, metodo_corte, duracion_corte],
        outputs=video_output
    )

if __name__ == "__main__":
    demo.queue().launch()