Spaces:

Athspi
/

Gysyeysg

Sleeping

App Files Files Community

Athspi commited on May 23

Commit

2d4c672

verified ·

1 Parent(s): 6802088

Update app.py

Browse files

Files changed (1) hide show

app.py +1 -49

app.py CHANGED Viewed

@@ -1,49 +1 @@
-import os
-import wave
-from google import genai
-from google.genai import types
-import gradio as gr
-# Load API key from Hugging Face environment variable
-client = genai.Client(api_key=os.getenv("GEMINI_API_KEY"))
-# Function to save PCM data to WAV
-def wave_file(filename, pcm, channels=1, rate=24000, sample_width=2):
-    with wave.open(filename, "wb") as wf:
-        wf.setnchannels(channels)
-        wf.setsampwidth(sample_width)
-        wf.setframerate(rate)
-        wf.writeframes(pcm)
-# Main function to generate speech
-def generate_audio(text):
-    response = client.models.generate_content(
-        model="gemini-2.5-flash-preview-tts",
-        contents=f"Say cheerfully: {text}",
-        config=types.GenerateContentConfig(
-            response_modalities=["AUDIO"],
-            speech_config=types.SpeechConfig(
-                voice_config=types.VoiceConfig(
-                    prebuilt_voice_config=types.PrebuiltVoiceConfig(
-                        voice_name='Kore',
-                    )
-                )
-            ),
-        )
-    )
-    data = response.candidates[0].content.parts[0].inline_data.data
-    file_name = "out.wav"
-    wave_file(file_name, data)
-    return file_name
-# Gradio interface
-iface = gr.Interface(
-    fn=generate_audio,
-    inputs=gr.Textbox(label="Text to Speak"),
-    outputs=gr.Audio(type="filepath", label="Generated Audio"),
-    title="Gemini 2.5 Flash TTS",
-)
-if __name__ == "__main__":
-    iface.launch()


1	+