Spaces:

Manasa1
/

AI_Comedy_Show

Runtime error

App Files Files Community

Manasa1 commited on Oct 14, 2024

Commit

ec5dc91

verified ·

1 Parent(s): 77f4d51

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -10

app.py CHANGED Viewed

@@ -8,17 +8,16 @@ from TTS.api import TTS
 from moviepy.editor import CompositeVideoClip, ImageClip, AudioFileClip, concatenate_videoclips, VideoFileClip
 import os
 from groq import Groq
-from deepgram import Deepgram
 import asyncio
 import aiohttp
 from dotenv import load_dotenv
 # Load environment variables
 load_dotenv()
 # Initialize Clients
 groq_client = Groq(api_key=os.getenv("GROQ_API_KEY"))
-deepgram_client = Deepgram(api_key=os.getenv("DEEPGRAM_API_KEY"))
 # Use GPT-3.5-turbo for text generation
 async def generate_comedy_script(prompt):
@@ -113,12 +112,17 @@ def generate_kids_content(theme):
     final_video.write_videofile("/tmp/kids_animation.mp4", fps=24)
     return music_file, "/tmp/kids_animation.mp4"
-# New function for speech-to-text
-async def transcribe_audio(audio_file):
-    with open(audio_file, 'rb') as audio:
-        source = {'buffer': audio, 'mimetype': 'audio/wav'}
-        response = await deepgram_client.transcription.prerecorded(source, {'smart_format': True, 'model': 'general'})
-        return response['results']['channels'][0]['alternatives'][0]['transcript']
 # Gradio Interface
 with gr.Blocks() as app:
@@ -151,7 +155,7 @@ with gr.Blocks() as app:
             outputs=[kids_music_audio, kids_music_video]
         )
-    # New Speech-to-Text Tab
     with gr.Tab("Speech-to-Text"):
         audio_input = gr.Audio(label="Upload Audio")
         transcribe_btn = gr.Button("Transcribe Audio")
@@ -165,4 +169,3 @@ with gr.Blocks() as app:
 app.launch()

 from moviepy.editor import CompositeVideoClip, ImageClip, AudioFileClip, concatenate_videoclips, VideoFileClip
 import os
 from groq import Groq
 import asyncio
 import aiohttp
 from dotenv import load_dotenv
+import speech_recognition as sr
 # Load environment variables
 load_dotenv()
 # Initialize Clients
 groq_client = Groq(api_key=os.getenv("GROQ_API_KEY"))
 # Use GPT-3.5-turbo for text generation
 async def generate_comedy_script(prompt):
     final_video.write_videofile("/tmp/kids_animation.mp4", fps=24)
     return music_file, "/tmp/kids_animation.mp4"
+# New function for speech-to-text using SpeechRecognition
+def transcribe_audio(audio_file):
+    recognizer = sr.Recognizer()
+    with sr.AudioFile(audio_file) as source:
+        audio = recognizer.record(source)
+    try:
+        return recognizer.recognize_google(audio)
+    except sr.UnknownValueError:
+        return "Speech recognition could not understand the audio"
+    except sr.RequestError as e:
+        return f"Could not request results from speech recognition service; {e}"
 # Gradio Interface
 with gr.Blocks() as app:
             outputs=[kids_music_audio, kids_music_video]
         )
+    # Speech-to-Text Tab
     with gr.Tab("Speech-to-Text"):
         audio_input = gr.Audio(label="Upload Audio")
         transcribe_btn = gr.Button("Transcribe Audio")
 app.launch()