Spaces:

Athspi-aitools
/

Aittsg

Running

App Files Files Community

Athspi commited on 6 days ago

Commit

5eaef53

verified ·

1 Parent(s): 7d3c0d1

Update app.py

Browse files

Files changed (1) hide show

app.py +36 -35

app.py CHANGED Viewed

@@ -1,11 +1,11 @@
-from fastapi import FastAPI, HTTPException, Request
 from fastapi.responses import JSONResponse, StreamingResponse
 from google import genai
 from google.genai import types
 import wave
 import io
 import os
-from typing import Optional
 from pydantic import BaseModel
 from dotenv import load_dotenv
@@ -13,13 +13,14 @@ from dotenv import load_dotenv
 load_dotenv()
 app = FastAPI(
-    title="Google GenAI TTS API",
-    description="API for text-to-speech conversion using Google GenAI",
-    version="1.0.0",
     docs_url="/docs",
     redoc_url=None
 )
 class TTSRequest(BaseModel):
     text: str
     voice_name: Optional[str] = "Kore"
@@ -28,15 +29,28 @@ class TTSRequest(BaseModel):
     channels: Optional[int] = 1
     sample_width: Optional[int] = 2
 def initialize_genai_client():
-    """Initialize the GenAI client with API key from environment"""
-    api_key = os.getenv("GEMINI_API_KEY")
-    if not api_key:
-        raise ValueError("GEMINI_API_KEY environment variable not set")
-    return genai.Client(api_key=api_key)
 def generate_wave_bytes(pcm_data: bytes, channels: int, rate: int, sample_width: int) -> bytes:
-    """Generate WAV file bytes from PCM data"""
     with io.BytesIO() as wav_buffer:
         with wave.open(wav_buffer, "wb") as wf:
             wf.setnchannels(channels)
@@ -48,24 +62,13 @@ def generate_wave_bytes(pcm_data: bytes, channels: int, rate: int, sample_width:
 @app.post("/api/generate-tts/")
 async def generate_tts(request: TTSRequest):
     """
-    Generate speech from text using Google GenAI TTS
-    Parameters:
-    - text: The text to convert to speech
-    - voice_name: Voice to use (default: 'Kore')
-    - cheerful: Whether to speak cheerfully (default: True)
-    - sample_rate: Audio sample rate (default: 24000)
-    - channels: Number of audio channels (default: 1)
-    - sample_width: Sample width in bytes (default: 2)
-    Returns:
-    - StreamingResponse with the WAV audio file
     """
     try:
         client = initialize_genai_client()
         text_to_speak = f"Say cheerfully: {request.text}" if request.cheerful else request.text
         response = client.models.generate_content(
             model="gemini-2.5-flash-preview-tts",
             contents=text_to_speak,
@@ -80,27 +83,25 @@ async def generate_tts(request: TTSRequest):
                 ),
             )
         )
         if not response.candidates or not response.candidates[0].content.parts:
-            raise HTTPException(status_code=500, detail="No audio data received from GenAI")
         audio_data = response.candidates[0].content.parts[0].inline_data.data
         wav_bytes = generate_wave_bytes(
             audio_data,
             channels=request.channels,
             rate=request.sample_rate,
             sample_width=request.sample_width
         )
         return StreamingResponse(
             io.BytesIO(wav_bytes),
             media_type="audio/wav",
-            headers={
-                "Content-Disposition": f"attachment; filename=generated_audio.wav"
-            }
         )
     except Exception as e:
         return JSONResponse(
             {"status": "error", "message": str(e)},
@@ -117,4 +118,4 @@ async def health_check():
 if __name__ == "__main__":
     import uvicorn
-    uvicorn.run(app, host="0.0.0.0", port=8080)

+from fastapi import FastAPI, HTTPException
 from fastapi.responses import JSONResponse, StreamingResponse
 from google import genai
 from google.genai import types
 import wave
 import io
 import os
+from typing import Optional, List
 from pydantic import BaseModel
 from dotenv import load_dotenv
 load_dotenv()
 app = FastAPI(
+    title="Google GenAI TTS API with Multiple API Keys",
+    description="Text-to-Speech API using Google GenAI with multiple API keys fallback.",
+    version="1.2.0",
     docs_url="/docs",
     redoc_url=None
 )
+# Pydantic model for request body
 class TTSRequest(BaseModel):
     text: str
     voice_name: Optional[str] = "Kore"
     channels: Optional[int] = 1
     sample_width: Optional[int] = 2
+def get_api_keys() -> List[str]:
+    """Retrieve list of API keys from environment variable"""
+    api_keys = os.getenv("GEMINI_API_KEYS")
+    if not api_keys:
+        raise ValueError("No API keys found in GEMINI_API_KEYS environment variable.")
+    return [key.strip() for key in api_keys.split(",") if key.strip()]
 def initialize_genai_client():
+    """Initialize the GenAI client by trying multiple API keys"""
+    api_keys = get_api_keys()
+    for key in api_keys:
+        try:
+            print(f"Trying API key: {key[:5]}...")  # Only show part for safety
+            client = genai.Client(api_key=key)
+            return client
+        except Exception as e:
+            print(f"Failed with key {key[:5]}... : {e}")
+    raise ValueError("No valid API key could initialize the GenAI client.")
 def generate_wave_bytes(pcm_data: bytes, channels: int, rate: int, sample_width: int) -> bytes:
+    """Convert PCM audio data into WAV bytes."""
     with io.BytesIO() as wav_buffer:
         with wave.open(wav_buffer, "wb") as wf:
             wf.setnchannels(channels)
 @app.post("/api/generate-tts/")
 async def generate_tts(request: TTSRequest):
     """
+    Convert text to speech audio using Google GenAI.
     """
     try:
         client = initialize_genai_client()
         text_to_speak = f"Say cheerfully: {request.text}" if request.cheerful else request.text
         response = client.models.generate_content(
             model="gemini-2.5-flash-preview-tts",
             contents=text_to_speak,
                 ),
             )
         )
         if not response.candidates or not response.candidates[0].content.parts:
+            raise HTTPException(status_code=500, detail="No audio data received from GenAI.")
         audio_data = response.candidates[0].content.parts[0].inline_data.data
         wav_bytes = generate_wave_bytes(
             audio_data,
             channels=request.channels,
             rate=request.sample_rate,
             sample_width=request.sample_width
         )
         return StreamingResponse(
             io.BytesIO(wav_bytes),
             media_type="audio/wav",
+            headers={"Content-Disposition": "attachment; filename=generated_audio.wav"}
         )
     except Exception as e:
         return JSONResponse(
             {"status": "error", "message": str(e)},
 if __name__ == "__main__":
     import uvicorn
+    uvicorn.run(app, host="0.0.0.0", port=8080)