Spaces:

Sid26Roy
/

mbti

Sleeping

Sid26Roy commited on Jul 17

Commit

46ea1cb

verified ·

1 Parent(s): 9959013

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -3,9 +3,9 @@ import torch
 import re
 from transformers import BertTokenizer, BertForSequenceClassification
 # import nltk
-from nltk.tokenize import word_tokenize
-from nltk.corpus import stopwords
-from nltk.stem import WordNetLemmatizer
 # Download required NLTK data
 # nltk.download("stopwords")
@@ -37,9 +37,9 @@ def preprocess_text(text):
     text = text.lower()
     text = re.sub(r"http\S+|www.\S+", "", text)
     text = re.sub(r"[^a-zA-Z\s]", "", text)
-    tokens = word_tokenize(text)
-    tokens = [lemmatizer.lemmatize(word) for word in tokens]
-    return " ".join(tokens)
 # Inference function
 def predict_mbti(text):

 import re
 from transformers import BertTokenizer, BertForSequenceClassification
 # import nltk
+# from nltk.tokenize import word_tokenize
+# from nltk.corpus import stopwords
+# from nltk.stem import WordNetLemmatizer
 # Download required NLTK data
 # nltk.download("stopwords")
     text = text.lower()
     text = re.sub(r"http\S+|www.\S+", "", text)
     text = re.sub(r"[^a-zA-Z\s]", "", text)
+    # tokens = word_tokenize(text)
+    # tokens = [lemmatizer.lemmatize(word) for word in tokens]
+    # return " ".join(tokens)
 # Inference function
 def predict_mbti(text):