Spaces:

chryzxc
/

portfolio-inference-provider

Sleeping

chryzxc commited on May 15

Commit

84f1ee8

verified ·

1 Parent(s): 4286dff

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,29 +1,28 @@
-from fastapi import FastAPI
-from fastapi.middleware.cors import CORSMiddleware
-import numpy as np
-from onnxruntime import InferenceSession
 from transformers import AutoTokenizer
-import os
 app = FastAPI()
-# CORS setup
-app.add_middleware(
-    CORSMiddleware,
-    allow_origins=["*"],
-    allow_methods=["*"],
-    allow_headers=["*"],
 )
-# Load model
 session = InferenceSession("model.onnx")
-tokenizer = AutoTokenizer.from_pretrained("Xenova/multi-qa-mpnet-base-dot-v1")
 @app.post("/predict")
 async def predict(query: str):
     inputs = tokenizer(query, return_tensors="np")
     inputs = {k: v.astype(np.int64) for k, v in inputs.items()}
-    outputs = session.run(None, inputs)
-    embedding = outputs[0][0].tolist()
-    return {"embedding": embedding}

 from transformers import AutoTokenizer
+from onnxruntime import InferenceSession
+import numpy as np
+import json
+from fastapi import FastAPI
 app = FastAPI()
+# Initialize components
+tokenizer = AutoTokenizer.from_pretrained(
+    "Xenova/multi-qa-mpnet-base-dot-v1",
+    use_fast=False  # Avoids framework dependencies
 )
 session = InferenceSession("model.onnx")
+def cosine_similarity(a, b):
+    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))
 @app.post("/predict")
 async def predict(query: str):
+    # Tokenize
     inputs = tokenizer(query, return_tensors="np")
     inputs = {k: v.astype(np.int64) for k, v in inputs.items()}
+    # Get embedding
+    embedding = session.run(None, inputs)[0][0]
+    return {"embedding": embedding.tolist()}