Spaces:

rshakked
/

safe-talk

Running

rshakked commited on May 11

Commit

58be06f

1 Parent(s): 643d98c

added app file and enable GPU training

Files changed (1) hide show

train_abuse_model.py CHANGED Viewed

@@ -14,6 +14,7 @@ from torch.utils.data import Dataset
 # Hugging Face transformers
 from transformers import (
     AutoTokenizer,
     BertTokenizer,
     BertForSequenceClassification,
     AutoModelForSequenceClassification,
@@ -21,6 +22,9 @@ from transformers import (
     TrainingArguments
 )
 # Custom Dataset class
 class AbuseDataset(Dataset):
     def __init__(self, texts, labels):
@@ -31,8 +35,8 @@ class AbuseDataset(Dataset):
         return len(self.labels)
     def __getitem__(self, idx):
-        item = {key: torch.tensor(val[idx]) for key, val in self.encodings.items()}
-        item["labels"] = torch.tensor(self.labels[idx], dtype=torch.float)
         return item
@@ -151,13 +155,13 @@ label_matrix = df["label_vector"].tolist()
 #model_name = "onlplab/alephbert-base"
 model_name = "microsoft/deberta-v3-base"
-# Load pretrained Hebrew model (AlephBERT) for fine-tuning
-tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForSequenceClassification.from_pretrained(
     model_name,
     num_labels=len(label_columns),
     problem_type="multi_label_classification"
-)
 # # Optional: Freeze base model layers (only train classifier head)
 # freeze_base = False

 # Hugging Face transformers
 from transformers import (
     AutoTokenizer,
+    DebertaV2Tokenizer,
     BertTokenizer,
     BertForSequenceClassification,
     AutoModelForSequenceClassification,
     TrainingArguments
 )
+# Check for GPU availability
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 # Custom Dataset class
 class AbuseDataset(Dataset):
     def __init__(self, texts, labels):
         return len(self.labels)
     def __getitem__(self, idx):
+        item = {key: torch.tensor(val[idx]).to(device) for key, val in self.encodings.items()}
+        item["labels"] = torch.tensor(self.labels[idx], dtype=torch.float).to(device)
         return item
 #model_name = "onlplab/alephbert-base"
 model_name = "microsoft/deberta-v3-base"
+# Load pretrained model for fine-tuning
+tokenizer = DebertaV2Tokenizer.from_pretrained(model_name)
 model = AutoModelForSequenceClassification.from_pretrained(
     model_name,
     num_labels=len(label_columns),
     problem_type="multi_label_classification"
+).to(device)  # Move model to GPU
 # # Optional: Freeze base model layers (only train classifier head)
 # freeze_base = False