Spaces:

Athspi-aitools
/

Aittsg

Running

App Files Files Community

Athspi commited on Jun 26

Commit

d5d02b0

verified ·

1 Parent(s): 6acc004

Update app.py

Browse files

Files changed (1) hide show

app.py +6 -15

app.py CHANGED Viewed

@@ -1,10 +1,7 @@
 from fastapi import FastAPI, Form
 from fastapi.responses import FileResponse, JSONResponse
-from pydantic import BaseModel
 import google.generativeai as genai
-from google.generativeai.types import GenerateContentRequest, GenerateContentResponse, Content, Part
-from google.generativeai.types import GenerateContentResponse, GenerateContentRequest, GenerationConfig
-from google.generativeai.types import SafetySetting, HarmBlockThreshold, HarmCategory, GenerateContentRequest, Content
 import wave
 import os
@@ -30,30 +27,24 @@ def wave_file(filename, pcm, channels=1, rate=24000, sample_width=2):
         wf.setframerate(rate)
         wf.writeframes(pcm)
-# Root endpoint to check API status
 @app.get("/")
 def read_root():
     return {"message": "✅ Gemini TTS FastAPI running on Hugging Face Spaces!"}
 # POST endpoint to generate TTS audio from text
 @app.post("/generate-audio")
 def generate_audio(text: str = Form(...)):
     try:
         response = model.generate_content(
             contents=text,
-            generation_config=genai.types.GenerationConfig(
                 response_mime_type="audio/wav"
             ),
-            safety_settings=[
-                SafetySetting(category=HarmCategory.HARM_CATEGORY_DANGEROUS_CONTENT, threshold=HarmBlockThreshold.BLOCK_NONE)
-            ],
-            tools=None,
             response_modality="AUDIO",
-            speech_config=genai.types.SpeechConfig(
-                voice_config=genai.types.VoiceConfig(
-                    prebuilt_voice_config=genai.types.PrebuiltVoiceConfig(
                         voice_name="Kore"
                     )
                 )

 from fastapi import FastAPI, Form
 from fastapi.responses import FileResponse, JSONResponse
 import google.generativeai as genai
+from google.generativeai.types import GenerationConfig, SpeechConfig, VoiceConfig, PrebuiltVoiceConfig
 import wave
 import os
         wf.setframerate(rate)
         wf.writeframes(pcm)
+# Root endpoint to confirm API is running
 @app.get("/")
 def read_root():
     return {"message": "✅ Gemini TTS FastAPI running on Hugging Face Spaces!"}
 # POST endpoint to generate TTS audio from text
 @app.post("/generate-audio")
 def generate_audio(text: str = Form(...)):
     try:
         response = model.generate_content(
             contents=text,
+            generation_config=GenerationConfig(
                 response_mime_type="audio/wav"
             ),
             response_modality="AUDIO",
+            speech_config=SpeechConfig(
+                voice_config=VoiceConfig(
+                    prebuilt_voice=PrebuiltVoiceConfig(
                         voice_name="Kore"
                     )
                 )