vision

Running

abdullahalioo commited on Apr 28

Commit

20d0b59

verified ·

1 Parent(s): 194ad81

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,25 +6,22 @@ import asyncio
 app = FastAPI()
-async def generate_ai_response(prompt: str):
-    # Get GitHub token from environment variable
-    token = os.getenv("GITHUB_TOKEN")
-    endpoint = "https://models.github.ai/inference"
-    model = "openai/gpt-4-1-mini"  # Fixed typo in model name (was gpt-4.1-mini)
-    # Initialize OpenAI client
-    client = AsyncOpenAI(base_url=endpoint, api_key=token)
     try:
         # Create streaming chat completion
         stream = await client.chat.completions.create(
             messages=[
                 {"role": "system", "content": "You are a helpful assistant."},
                 {"role": "user", "content": prompt}
             ],
-            temperature=1.0,
             top_p=1.0,
-            model=model,
             stream=True
         )
@@ -35,14 +32,21 @@ async def generate_ai_response(prompt: str):
                 yield content
     except Exception as err:
-        yield f"The sample encountered an error: {err}"
 @app.post("/generate")
 async def generate_response(request: Request):
-    data = await request.json()
-    prompt = data.get("prompt", "what is ai")  # Default prompt if none provided
-    return StreamingResponse(
-        generate_ai_response(prompt),
-        media_type="text/event-stream"
-    )

 app = FastAPI()
+# Initialize OpenAI client once when the app starts
+client = AsyncOpenAI(
+    api_key=os.getenv("OPENAI_API_KEY")  # Get API key from environment variable
+)
+async def generate_ai_response(prompt: str):
     try:
         # Create streaming chat completion
         stream = await client.chat.completions.create(
+            model="gpt-3.5-turbo",  # or "gpt-3.5-turbo" for faster/cheaper responses
             messages=[
                 {"role": "system", "content": "You are a helpful assistant."},
                 {"role": "user", "content": prompt}
             ],
+            temperature=0.7,  # Slightly less random than 1.0 for better coherence
             top_p=1.0,
             stream=True
         )
                 yield content
     except Exception as err:
+        yield f"Error generating response: {str(err)}"
 @app.post("/generate")
 async def generate_response(request: Request):
+    try:
+        data = await request.json()
+        prompt = data.get("prompt", "")  # Empty string if no prompt provided
+        if not prompt:
+            return {"error": "No prompt provided"}, 400
+        return StreamingResponse(
+            generate_ai_response(prompt),
+            media_type="text/event-stream"
+        )
+    except Exception as e:
+        return {"error": f"Invalid request: {str(e)}"}, 400