Spaces:

Sid26Roy
/

mbti

Sleeping

Sid26Roy commited on Jul 17

Commit

5342693

verified ·

1 Parent(s): c3a7c62

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,15 +2,15 @@ import gradio as gr
 import torch
 import re
 from transformers import BertTokenizer, BertForSequenceClassification
-import nltk
 from nltk.tokenize import word_tokenize
 from nltk.corpus import stopwords
 from nltk.stem import WordNetLemmatizer
 # Download required NLTK data
-nltk.download("stopwords")
-nltk.download("punkt")
-nltk.download("wordnet")
 # Load model and tokenizer
 model_name = "./model"
@@ -21,7 +21,7 @@ model.to(device)
 model.eval()
 # NLP tools
-stop_words = set(stopwords.words("english"))
 lemmatizer = WordNetLemmatizer()
 # MBTI Labels
@@ -38,7 +38,7 @@ def preprocess_text(text):
     text = re.sub(r"http\S+|www.\S+", "", text)
     text = re.sub(r"[^a-zA-Z\s]", "", text)
     tokens = word_tokenize(text)
-    tokens = [lemmatizer.lemmatize(word) for word in tokens if word not in stop_words]
     return " ".join(tokens)
 # Inference function

 import torch
 import re
 from transformers import BertTokenizer, BertForSequenceClassification
+# import nltk
 from nltk.tokenize import word_tokenize
 from nltk.corpus import stopwords
 from nltk.stem import WordNetLemmatizer
 # Download required NLTK data
+# nltk.download("stopwords")
+# nltk.download("punkt")
+# nltk.download("wordnet")
 # Load model and tokenizer
 model_name = "./model"
 model.eval()
 # NLP tools
+# stop_words = set(stopwords.words("english"))
 lemmatizer = WordNetLemmatizer()
 # MBTI Labels
     text = re.sub(r"http\S+|www.\S+", "", text)
     text = re.sub(r"[^a-zA-Z\s]", "", text)
     tokens = word_tokenize(text)
+    tokens = [lemmatizer.lemmatize(word) for word in tokens]
     return " ".join(tokens)
 # Inference function