Spaces:

Baleegh
/

Fluency_Score

Sleeping

App Files Files Community

Abdulmohsena commited on Mar 3

Commit

d95c212

verified ·

1 Parent(s): 7d4d553

Update Fluency_Score.py

Browse files

Files changed (1) hide show

Fluency_Score.py +23 -24

Fluency_Score.py CHANGED Viewed

@@ -3,13 +3,12 @@ import datasets
 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 import torch
-class Fluency_Score(evaluate.Measurement):
     def _info(self):
-        return evaluate.MeasurementInfo(
-            description="",
             citation="",
-            inputs_description="",
             features=datasets.Features(
                 {
                     "texts": datasets.Value("string", id="sequence"),
@@ -17,31 +16,31 @@ class Fluency_Score(evaluate.Measurement):
             ),
             reference_urls=[],
         )
-    def _download_and_prepare(self, dl_manager, device=None):
         if device is None:
             device = "cuda" if torch.cuda.is_available() else "cpu"
-        # Load the tokenizer and model from the specified repository
         self.tokenizer = AutoTokenizer.from_pretrained("Baleegh/Fluency_Score")
         self.model = AutoModelForSequenceClassification.from_pretrained("Baleegh/Fluency_Score")
-        self.model.to(device)
-        self.device = device
-    def _compute(self, texts, temperature=2):
-        device = self.device
         inputs = self.tokenizer(
-            texts,
-            return_tensors="pt",
-            truncation=True,
-            padding='max_length',
             max_length=128
-        ).to(device)
-        with torch.inference_mode():
             output = self.model(**inputs)
-            prediction = output.logits.clip(0, 1)
-        return {"classical_score": prediction}

 from transformers import AutoTokenizer, AutoModelForSequenceClassification
 import torch
+class FluencyScore(evaluate.Metric):
     def _info(self):
+        return evaluate.MetricInfo(
+            description="Computes the fluency score of a given text using a pre-trained model.",
             citation="",
+            inputs_description="A list of text strings to evaluate for fluency.",
             features=datasets.Features(
                 {
                     "texts": datasets.Value("string", id="sequence"),
             ),
             reference_urls=[],
         )
+    def __init__(self, device=None):
+        super().__init__()
         if device is None:
             device = "cuda" if torch.cuda.is_available() else "cpu"
+        self.device = device
+        # Load the tokenizer and model
         self.tokenizer = AutoTokenizer.from_pretrained("Baleegh/Fluency_Score")
         self.model = AutoModelForSequenceClassification.from_pretrained("Baleegh/Fluency_Score")
+        self.model.to(self.device)
+    def _compute(self, texts):
+        # Tokenize the input texts
         inputs = self.tokenizer(
+            texts,
+            return_tensors="pt",
+            truncation=True,
+            padding='max_length',
             max_length=128
+        ).to(self.device)
+        # Get model predictions
+        with torch.no_grad():
             output = self.model(**inputs)
+            predictions = output.logits.clip(0, 1).squeeze().tolist()  # Convert to list
+        return {"fluency_scores": predictions}