submission-template

Sleeping

csk99 commited on Jan 29

Commit

2c1c057

verified ·

1 Parent(s): 7cadf7a

Update tasks/text.py

Files changed (1) hide show

tasks/text.py CHANGED Viewed

@@ -73,8 +73,7 @@ async def evaluate_text(request: TextEvaluationRequest):
     # Load a pre-trained Sentence-BERT model
     print("loading model")
     model = SentenceTransformer('sentence-transformers/all-MPNET-base-v2', device='cpu')
-    # Generate sentence embeddings
-    sentence_embeddings = model.encode(test_dataset["quote"])
     #load the models
     with open("xgb_bin.pkl","rb") as f:
@@ -84,18 +83,16 @@ async def evaluate_text(request: TextEvaluationRequest):
         xgb_multi = pickle.load(f)
-    # Load the binary model
-    #xgb_bin = xgb.Booster()
-    #xgb_bin.load_model("xgb_model_bin.bin")
-        # Load the binary model
-    #xgb_multi = xgb.Booster()
-    #xgb_multi.load_model("xgb_model_muli.bin")
     X_train = sentence_embeddings.copy()
     y_train = np.array(test_dataset["label"].copy())
@@ -105,9 +102,12 @@ async def evaluate_text(request: TextEvaluationRequest):
     y_train_binary[y_train_binary != 0] = 1
     #multi class
     X_train_multi = X_train[y_train != 0]
     y_train_multi = y_train[y_train != 0]
     logging.info(f"Xtrain_multi_shape:{X_train_multi.shape}")
@@ -125,7 +125,7 @@ async def evaluate_text(request: TextEvaluationRequest):
     logging.info(f"y_pred_bin:{y_pred_bin.shape}")
     logging.info(f"y_pred_multi shape:{y_pred_multi.shape}")
-    y_pred_bin[y_pred_bin==1] = y_pred_multi

     # Load a pre-trained Sentence-BERT model
     print("loading model")
     model = SentenceTransformer('sentence-transformers/all-MPNET-base-v2', device='cpu')
     #load the models
     with open("xgb_bin.pkl","rb") as f:
         xgb_multi = pickle.load(f)
+    logging.info("generating embedding")
+    # Generate sentence embeddings
+    sentence_embeddings = model.encode(test_dataset["quote"])
+    logging.info(" embedding done")
     X_train = sentence_embeddings.copy()
     y_train = np.array(test_dataset["label"].copy())
     y_train_binary[y_train_binary != 0] = 1
     #multi class
     X_train_multi = X_train[y_train != 0]
     y_train_multi = y_train[y_train != 0]
     logging.info(f"Xtrain_multi_shape:{X_train_multi.shape}")
     logging.info(f"y_pred_bin:{y_pred_bin.shape}")
     logging.info(f"y_pred_multi shape:{y_pred_multi.shape}")
+    y_pred_bin[y_train==1] = y_pred_multi