Spaces:

chryzxc
/

portfolio-inference-provider

Running

chryzxc commited on 17 days ago

Commit

befb5c8

verified ·

1 Parent(s): 32854a5

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,18 +5,18 @@ import numpy as np
 app = FastAPI()
 # Load ONNX model only
-session = InferenceSession("model.onnx")
 @app.post("/predict")
 async def predict(inputs: dict):
     # Expect pre-tokenized input from client
-    input_ids = np.array(inputs["input_ids"], dtype=np.int64)
-    attention_mask = np.array(inputs["attention_mask"], dtype=np.int64)
     # Run model
-    outputs = session.run(None, {
-        "input_ids": input_ids,
-        "attention_mask": attention_mask
-    })
-    return {"embedding": outputs[0].tolist()}

 app = FastAPI()
 # Load ONNX model only
+# session = InferenceSession("model.onnx")
 @app.post("/predict")
 async def predict(inputs: dict):
     # Expect pre-tokenized input from client
+    ##input_ids = np.array(inputs["input_ids"], dtype=np.int64)
+    #attention_mask = np.array(inputs["attention_mask"], dtype=np.int64)
     # Run model
+    #outputs = session.run(None, {
+    #    "input_ids": input_ids,
+    #    "attention_mask": attention_mask
+    #})
+    return "Status ok"
+    #return {"embedding": outputs[0].tolist()}