Spaces:

Manasa1
/

AI_Comedy_Show

Runtime error

App Files Files Community

Manasa1 commited on Oct 14, 2024

Commit

711451c

verified ·

1 Parent(s): d563fad

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -24

app.py CHANGED Viewed

@@ -7,32 +7,27 @@ import scipy.io.wavfile
 from TTS.api import TTS  # Coqui TTS (open source)
 from moviepy.editor import CompositeVideoClip, ImageClip, AudioFileClip, concatenate_videoclips
-# Load and Initialize Models
-# Use GPT-2 (open-source) for text generation
-script_generator = pipeline("text-generation", model="gpt2", truncation=True, max_length=100)
 # Use Stable Diffusion (open-source) for image generation
 image_generator = StableDiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-2-1-base", torch_dtype=torch.float16).to("cpu")
-# Use MusicGen (open-source) for music generation
 music_generator = pipeline("text-to-audio", model="facebook/musicgen-small", device="cpu")
 # Use Coqui TTS (open-source) for text-to-speech
 tts = TTS(model_name="tts_models/en/ljspeech/tacotron2-DDC", progress_bar=False, gpu=False)
-# Generate Comedy Script
 def generate_comedy_script(prompt):
     script = script_generator(prompt)[0]['generated_text']
     return script
-# Convert Text to Speech using Coqui TTS
 def text_to_speech(script):
     output_audio = 'output.wav'
     tts.tts_to_file(text=script, file_path=output_audio)
     return output_audio
-# Create Images Using Stable Diffusion
 def create_images_from_script(script):
     lines = script.split('. ')
     image_paths = []
@@ -43,7 +38,6 @@ def create_images_from_script(script):
         image_paths.append(img_path)
     return image_paths
-# Generate Fun Music Track using MusicGen
 def generate_fun_music(prompt, output_music_file="fun_music.wav"):
     # Generate music based on the prompt using MusicGen
     response = music_generator(prompt)
@@ -57,19 +51,16 @@ def generate_fun_music(prompt, output_music_file="fun_music.wav"):
     return output_music_file
-# Create Video from Generated Images
 def generate_text_video(script):
     image_paths = create_images_from_script(script)
     clips = []
     for img_path in image_paths:
         image_clip = ImageClip(img_path).set_duration(3).set_position(('center', 'center'))
         clips.append(image_clip)
     final_video = concatenate_videoclips(clips, method="compose")
     final_video.write_videofile("/tmp/final_video.mp4", fps=24)
     return "/tmp/final_video.mp4"
-# Combine Audio and Video
 def combine_audio_video(video_path, audio_path):
     video = VideoFileClip(video_path)
     audio = AudioFileClip(audio_path)
@@ -77,7 +68,6 @@ def combine_audio_video(video_path, audio_path):
     final_video.write_videofile("/tmp/final_comedy_video.mp4", fps=24)
     return "/tmp/final_comedy_video.mp4"
-# Main Function to Generate Comedy Animation
 def generate_comedy_and_animation(prompt):
     script = generate_comedy_script(prompt)
     audio_file = text_to_speech(script)
@@ -86,8 +76,7 @@ def generate_comedy_and_animation(prompt):
     final_video = combine_audio_video(video_file, fun_music)
     return script, audio_file, final_video
-# Generate Kids Music Animation
-def generate_kids_animation_with_music(theme, output_video_file="kids_animation.mp4"):
     music_file = generate_fun_music(theme, output_music_file="kids_music.wav")
     clips = []
     for i in range(5):
@@ -98,18 +87,11 @@ def generate_kids_animation_with_music(theme, output_video_file="kids_animation.
         frame_path = f'/tmp/kids_temp_{i}.png'
         img.save(frame_path)
         clips.append(ImageClip(frame_path).set_duration(1).set_position(('center', 'center')))
     final_video = CompositeVideoClip(clips, size=(800, 400))
     final_video = final_video.set_audio(AudioFileClip(music_file))
-    final_video.write_videofile(output_video_file, fps=24)
-    return music_file, output_video_file
-# Main Function to Generate Kids Content
-def generate_kids_content(theme):
-    music_file, video_file = generate_kids_animation_with_music(theme)
-    return music_file, video_file
-# Gradio Interface
 with gr.Blocks() as app:
     gr.Markdown("## AI Comedy and Kids Content Generator")

 from TTS.api import TTS  # Coqui TTS (open source)
 from moviepy.editor import CompositeVideoClip, ImageClip, AudioFileClip, concatenate_videoclips
+# Use GPT-2 Medium (lighter version) for text generation
+script_generator = pipeline("text-generation", model="gpt2-medium", truncation=True, max_length=100)
 # Use Stable Diffusion (open-source) for image generation
 image_generator = StableDiffusionPipeline.from_pretrained("stabilityai/stable-diffusion-2-1-base", torch_dtype=torch.float16).to("cpu")
+# Use MusicGen Small (open-source) for music generation
 music_generator = pipeline("text-to-audio", model="facebook/musicgen-small", device="cpu")
 # Use Coqui TTS (open-source) for text-to-speech
 tts = TTS(model_name="tts_models/en/ljspeech/tacotron2-DDC", progress_bar=False, gpu=False)
 def generate_comedy_script(prompt):
     script = script_generator(prompt)[0]['generated_text']
     return script
 def text_to_speech(script):
     output_audio = 'output.wav'
     tts.tts_to_file(text=script, file_path=output_audio)
     return output_audio
 def create_images_from_script(script):
     lines = script.split('. ')
     image_paths = []
         image_paths.append(img_path)
     return image_paths
 def generate_fun_music(prompt, output_music_file="fun_music.wav"):
     # Generate music based on the prompt using MusicGen
     response = music_generator(prompt)
     return output_music_file
 def generate_text_video(script):
     image_paths = create_images_from_script(script)
     clips = []
     for img_path in image_paths:
         image_clip = ImageClip(img_path).set_duration(3).set_position(('center', 'center'))
         clips.append(image_clip)
     final_video = concatenate_videoclips(clips, method="compose")
     final_video.write_videofile("/tmp/final_video.mp4", fps=24)
     return "/tmp/final_video.mp4"
 def combine_audio_video(video_path, audio_path):
     video = VideoFileClip(video_path)
     audio = AudioFileClip(audio_path)
     final_video.write_videofile("/tmp/final_comedy_video.mp4", fps=24)
     return "/tmp/final_comedy_video.mp4"
 def generate_comedy_and_animation(prompt):
     script = generate_comedy_script(prompt)
     audio_file = text_to_speech(script)
     final_video = combine_audio_video(video_file, fun_music)
     return script, audio_file, final_video
+def generate_kids_content(theme):
     music_file = generate_fun_music(theme, output_music_file="kids_music.wav")
     clips = []
     for i in range(5):
         frame_path = f'/tmp/kids_temp_{i}.png'
         img.save(frame_path)
         clips.append(ImageClip(frame_path).set_duration(1).set_position(('center', 'center')))
     final_video = CompositeVideoClip(clips, size=(800, 400))
     final_video = final_video.set_audio(AudioFileClip(music_file))
+    final_video.write_videofile("/tmp/kids_animation.mp4", fps=24)
+    return music_file, "/tmp/kids_animation.mp4"
 with gr.Blocks() as app:
     gr.Markdown("## AI Comedy and Kids Content Generator")