Spaces:

UcsTurkey
/

test-oncu

Paused

App Files Files Community

ciyidogan commited on May 30

Commit

883403d

verified ·

1 Parent(s): 8c976f2

Update app.py

Browse files

Files changed (1) hide show

app.py +0 -63

app.py CHANGED Viewed

@@ -58,66 +58,3 @@ class UserInputRequest(BaseModel):
 def generate(req: UserInputRequest):
     try:
         start_time = time.time()
-        log(f"💬 Kullanıcı isteği alındı: {req.user_input}")
-        messages = [
-            {"role": "system", "content": req.system_prompt},
-            {"role": "user", "content": req.user_input}
-        ]
-        input_data = tokenizer.apply_chat_template(
-            messages,
-            add_generation_prompt=True,
-            return_tensors="pt",
-            padding=True
-        ).to(model.device)
-        input_ids = input_data['input_ids']
-        attention_mask = input_data['attention_mask']
-        # === Dinamik token hesaplama
-        total_ctx = model.config.max_position_embeddings if hasattr(model.config, 'max_position_embeddings') else 4096
-        input_len = input_ids.shape[-1]
-        max_new_tokens = max(1, total_ctx - input_len)
-        log(f"ℹ️ Input uzunluğu: {input_len}, max_new_tokens ayarlandı: {max_new_tokens}")
-        terminators = [
-            tokenizer.eos_token_id,
-            tokenizer.convert_tokens_to_ids("<|eot_id|>") if "<|eot_id|>" in tokenizer.get_vocab() else tokenizer.eos_token_id
-        ]
-        outputs = model.generate(
-            input_ids=input_ids,
-            attention_mask=attention_mask,
-            max_new_tokens=max_new_tokens,
-            eos_token_id=terminators
-        )
-        response = outputs[0][input_len:]
-        answer = tokenizer.decode(response, skip_special_tokens=True)
-        end_time = time.time()
-        elapsed = end_time - start_time
-        log(f"✅ Yanıt süresi: {elapsed:.2f} saniye")
-        return {"response": answer}
-    except Exception as e:
-        log(f"❌ /generate hatası: {e}")
-        traceback.print_exc()
-        raise HTTPException(status_code=500, detail=str(e))
-@app.get("/")
-def health():
-    return {"status": "ok"}
-def run_health_server():
-    import uvicorn
-    uvicorn.run(app, host="0.0.0.0", port=7860)
-threading.Thread(target=run_health_server, daemon=True).start()
-log("⏸️ Uygulama bekleme modunda...")
-while True:
-    time.sleep(60)

 def generate(req: UserInputRequest):
     try:
         start_time = time.time()