Spaces:

unitxt
/

metric

Running

App Files Files Community

Elron commited on Aug 16, 2023

Commit

902ea7b

1 Parent(s): b5ec139

Upload metrics.py with huggingface_hub

Browse files

Files changed (1) hide show

metrics.py +41 -2

metrics.py CHANGED Viewed

@@ -8,6 +8,7 @@ import evaluate
 import nltk
 import numpy
 from .operator import (
     MultiStreamOperator,
     SingleStreamOperator,
@@ -60,7 +61,13 @@ class GlobalMetric(SingleStreamOperator, Metric):
             refs, pred = instance["references"], instance["prediction"]
-            instance_score = self._compute([refs], [pred])
             instance["score"]["instance"].update(instance_score)
             references.append(refs)
@@ -355,8 +362,27 @@ class Bleu(HuggingfaceMetric):
     scale = 1.0
 class CustomF1(GlobalMetric):
     main_score = "f1_micro"
     @abstractmethod
     def get_element_group(self, element):
@@ -391,6 +417,10 @@ class CustomF1(GlobalMetric):
         assert len(references) == len(predictions), (
             f"references size ({len(references)})" f" doesn't mach predictions sise ({len(references)})."
         )
         groups_statistics = dict()
         for references_batch, predictions_batch in zip(references, predictions):
             grouped_references = self.group_elements(references_batch)
@@ -418,6 +448,7 @@ class CustomF1(GlobalMetric):
                 groups_statistics[group]["recall_denominator"] += rd
         result = {}
         pn_total = pd_total = rn_total = rd_total = 0
         for group in groups_statistics.keys():
             pn, pd, rn, rd = (
@@ -426,13 +457,21 @@ class CustomF1(GlobalMetric):
                 groups_statistics[group]["recall_numerator"],
                 groups_statistics[group]["recall_denominator"],
             )
-            result[f"f1_{group}"] = self.f1(pn, pd, rn, rd)
             pn_total, pd_total, rn_total, rd_total = pn_total + pn, pd_total + pd, rn_total + rn, rd_total + rd
         try:
             result["f1_macro"] = sum(result.values()) / len(result.keys())
         except ZeroDivisionError:
             result["f1_macro"] = 1.0
         result[f"f1_micro"] = self.f1(pn_total, pd_total, rn_total, rd_total)
         return result

 import nltk
 import numpy
+from .dataclass import InternalField
 from .operator import (
     MultiStreamOperator,
     SingleStreamOperator,
             refs, pred = instance["references"], instance["prediction"]
+            try:
+                instance_score = self._compute([refs], [pred])
+            except:
+                instance_score = {"score": None}
+                if isinstance(self.main_score, str) and self.main_score is not None:
+                    instance_score[self.main_score] = None
             instance["score"]["instance"].update(instance_score)
             references.append(refs)
     scale = 1.0
+class MatthewsCorrelation(HuggingfaceMetric):
+    metric_name = "matthews_correlation"
+    main_score = "matthews_correlation"
+    str_to_id: dict = InternalField(default_factory=dict)
+    def get_str_id(self, str):
+        if str not in self.str_to_id:
+            id = len(self.str_to_id)
+            self.str_to_id[str] = id
+        return self.str_to_id[str]
+    def compute(self, references: List[List[str]], predictions: List[str]) -> dict:
+        formatted_references = [self.get_str_id(reference[0]) for reference in references]
+        formatted_predictions = [self.get_str_id(prediction) for prediction in predictions]
+        result = self.metric.compute(predictions=formatted_predictions, references=formatted_references)
+        return result
 class CustomF1(GlobalMetric):
     main_score = "f1_micro"
+    classes = None
     @abstractmethod
     def get_element_group(self, element):
         assert len(references) == len(predictions), (
             f"references size ({len(references)})" f" doesn't mach predictions sise ({len(references)})."
         )
+        if self.classes is None:
+            classes = set([self.get_element_group(e) for sublist in references for e in sublist])
+        else:
+            classes = self.classes
         groups_statistics = dict()
         for references_batch, predictions_batch in zip(references, predictions):
             grouped_references = self.group_elements(references_batch)
                 groups_statistics[group]["recall_denominator"] += rd
         result = {}
+        num_of_unknown_class_predictions = 0
         pn_total = pd_total = rn_total = rd_total = 0
         for group in groups_statistics.keys():
             pn, pd, rn, rd = (
                 groups_statistics[group]["recall_numerator"],
                 groups_statistics[group]["recall_denominator"],
             )
             pn_total, pd_total, rn_total, rd_total = pn_total + pn, pd_total + pd, rn_total + rn, rd_total + rd
+            if group in classes:
+                result[f"f1_{group}"] = self.f1(pn, pd, rn, rd)
+            else:
+                num_of_unknown_class_predictions += pd
         try:
             result["f1_macro"] = sum(result.values()) / len(result.keys())
         except ZeroDivisionError:
             result["f1_macro"] = 1.0
+        amount_of_predictions = pd_total
+        if amount_of_predictions == 0:
+            result["in_classes_support"] = 1.0
+        else:
+            result["in_classes_support"] = 1.0 - num_of_unknown_class_predictions / amount_of_predictions
         result[f"f1_micro"] = self.f1(pn_total, pd_total, rn_total, rd_total)
         return result