Spaces:

Sirawitch
/

kkulchatbot

Runtime error

App Files Files Community

Sirawitch commited on Sep 19, 2024

Commit

7166b9d

verified ·

1 Parent(s): 0dc5c52

Update app.py

Browse files

Files changed (1) hide show

app.py +16 -48

app.py CHANGED Viewed

@@ -1,44 +1,20 @@
-from fastapi import FastAPI, HTTPException, Request
-from fastapi.responses import JSONResponse
 from pydantic import BaseModel
 from typing import Optional
-from huggingface_hub import InferenceClient
-import uvicorn
-from fastapi.middleware.cors import CORSMiddleware
 app = FastAPI()
-# CORS middleware
-app.add_middleware(
-    CORSMiddleware,
-    allow_origins=["*"],
-    allow_credentials=True,
-    allow_methods=["*"],  # หรือระบุเจาะจง ["GET", "POST", "OPTIONS"]
-    allow_headers=["*"],
-)
-# Hugging Face client
-client = InferenceClient("scb10x/llama-3-typhoon-v1.5-8b-instruct")
-# Pydantic model for query
 class Query(BaseModel):
     queryResult: Optional[dict] = None
     queryText: Optional[str] = None
-# Root route
-@app.get("/")
-async def root():
-    return {"message": "Welcome to the API"}
-@app.options("/webhook")
-async def webhook_options():
-    return {"message": "OK"}
-@app.get("/test")
-async def test():
-    return {"message": "Test successful"}
-# Webhook route
 @app.post("/webhook")
 async def webhook(query: Query):
     try:
@@ -47,24 +23,16 @@ async def webhook(query: Query):
         if not user_query:
             raise HTTPException(status_code=400, detail="No query text provided")
-        messages = [
-            {"role": "system", "content": "You are a friendly Chatbot."},
-            {"role": "user", "content": user_query}
-        ]
-        response = client.chat_completion(
-            messages,
-            max_tokens=512,
-            temperature=0.7,
-            top_p=0.95,
-        )
-        model_reply = response.choices[0].message.content.strip()
-        return {"fulfillmentText": model_reply}
     except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
-# Run the app
-if __name__ == "__main__":
-    uvicorn.run(app, host="0.0.0.0", port=7860)

+from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from typing import Optional
+from transformers import AutoTokenizer, AutoModelForCausalLM
+import torch
 app = FastAPI()
+# โหลดโมเดลและ tokenizer
+model_name = "scb10x/llama-3-typhoon-v1.5-8b-instruct"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16, device_map="auto")
 class Query(BaseModel):
     queryResult: Optional[dict] = None
     queryText: Optional[str] = None
 @app.post("/webhook")
 async def webhook(query: Query):
     try:
         if not user_query:
             raise HTTPException(status_code=400, detail="No query text provided")
+        # สร้าง prompt และ generate ข้อความ
+        prompt = f"Human: {user_query}\nAI:"
+        input_ids = tokenizer.encode(prompt, return_tensors="pt").to(model.device)
+        output = model.generate(input_ids, max_new_tokens=100, temperature=0.7)
+        response = tokenizer.decode(output[0], skip_special_tokens=True)
+        # แยกส่วนที่เป็นคำตอบของ AI
+        ai_response = response.split("AI:")[-1].strip()
+        return {"fulfillmentText": ai_response}
     except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))