Spaces:

transZ
/

sbert_cosine

Runtime error

transZ commited on Feb 27, 2023

Commit

03539db

1 Parent(s): d691a4b

Working version

Files changed (1) hide show

sbert_cosine.py CHANGED Viewed

@@ -104,7 +104,7 @@ class sbert_cosine(evaluate.Metric):
             input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
             return torch.sum(token_embeddings * input_mask_expanded, 1) / torch.clamp(input_mask_expanded.sum(1), min=1e-9)
-        def batch_to_device(batch, target_device: device):
             """
             send a pytorch batch to a device (CPU/GPU)
             """
@@ -118,18 +118,20 @@ class sbert_cosine(evaluate.Metric):
         tokenizer = AutoTokenizer.from_pretrained(model_type)
         model = BertModel.from_pretrained(model_type)
         model = model.to(device)
-        cosine = nn.CosineSimilarity()
         def calculate(x: str, y: str):
             encoded_input = tokenizer([x, y], padding=True, truncation=True, return_tensors='pt')
-            encoded_input = batch_to_device(encode_input, device)
             model_output = model(**encoded_input)
             embeds = mean_pooling(model_output, encoded_input['attention_mask'])
             res = cosine(embeds[0, :], embeds[1, :]).item()
             return res
         with torch.no_grad():
-            score = torch.mean([calculate(pred, ref) for pred, ref in zip(predictions, references)]).item()
         return {
             "score": score,

             input_mask_expanded = attention_mask.unsqueeze(-1).expand(token_embeddings.size()).float()
             return torch.sum(token_embeddings * input_mask_expanded, 1) / torch.clamp(input_mask_expanded.sum(1), min=1e-9)
+        def batch_to_device(batch, target_device):
             """
             send a pytorch batch to a device (CPU/GPU)
             """
         tokenizer = AutoTokenizer.from_pretrained(model_type)
         model = BertModel.from_pretrained(model_type)
         model = model.to(device)
+        cosine = nn.CosineSimilarity(dim=0)
         def calculate(x: str, y: str):
             encoded_input = tokenizer([x, y], padding=True, truncation=True, return_tensors='pt')
+            encoded_input = batch_to_device(encoded_input, device)
             model_output = model(**encoded_input)
             embeds = mean_pooling(model_output, encoded_input['attention_mask'])
             res = cosine(embeds[0, :], embeds[1, :]).item()
             return res
+        avg = lambda x: sum(x) / len(x)
         with torch.no_grad():
+            score = avg([calculate(pred, ref) for pred, ref in zip(predictions, references)])
         return {
             "score": score,