Spaces:

service-internal
/

sentiment-analysis

Sleeping

service-internal commited on 30 days ago

Commit

6644ffe

verified ·

1 Parent(s): b053f3d

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -1,24 +1,20 @@
 from fastapi import FastAPI, Request
-from transformers import AutoModelForSequenceClassification, AutoConfig, RobertaTokenizer
 from scipy.special import softmax
 import numpy as np
-import os
 app = FastAPI()
-# Set HF cache and home directory to writable path
-os.environ["TRANSFORMERS_CACHE"] = "/tmp/hf-cache"
-os.environ["HF_HOME"] = "/tmp/hf-home"
-# Model and tokenizer setup
 MODEL = "cardiffnlp/twitter-roberta-base-sentiment-latest"
-TOKENIZER_MODEL = "cardiffnlp/twitter-roberta-base-sentiment"
-tokenizer = RobertaTokenizer.from_pretrained(TOKENIZER_MODEL)
 config = AutoConfig.from_pretrained(MODEL)
 model = AutoModelForSequenceClassification.from_pretrained(MODEL)
-# Preprocessing
 def preprocess(text):
     tokens = []
     for t in text.split():
@@ -29,22 +25,17 @@ def preprocess(text):
         tokens.append(t)
     return " ".join(tokens)
-# Endpoint
 @app.post("/analyze")
 async def analyze(request: Request):
     data = await request.json()
     text = preprocess(data.get("text", ""))
     encoded_input = tokenizer(text, return_tensors='pt')
     output = model(**encoded_input)
     scores = output[0][0].detach().numpy()
     scores = softmax(scores)
-    ranking = np.argsort(scores)[::-1]
-    result = []
-    for i in ranking:
-        label = config.id2label[i]
-        score = round(float(scores[i]), 4)
-        result.append({"label": label, "score": score})
     return {"result": result}

+import os
+os.environ["TRANSFORMERS_CACHE"] = "/tmp/hf-cache"
+os.environ["HF_HOME"] = "/tmp/hf-home"
 from fastapi import FastAPI, Request
+from transformers import AutoModelForSequenceClassification, AutoTokenizer, AutoConfig
 from scipy.special import softmax
 import numpy as np
 app = FastAPI()
 MODEL = "cardiffnlp/twitter-roberta-base-sentiment-latest"
+tokenizer = AutoTokenizer.from_pretrained(MODEL)
 config = AutoConfig.from_pretrained(MODEL)
 model = AutoModelForSequenceClassification.from_pretrained(MODEL)
 def preprocess(text):
     tokens = []
     for t in text.split():
         tokens.append(t)
     return " ".join(tokens)
 @app.post("/analyze")
 async def analyze(request: Request):
     data = await request.json()
     text = preprocess(data.get("text", ""))
     encoded_input = tokenizer(text, return_tensors='pt')
     output = model(**encoded_input)
     scores = output[0][0].detach().numpy()
     scores = softmax(scores)
+    result = [
+        {"label": config.id2label[i], "score": round(float(scores[i]), 4)}
+        for i in scores.argsort()[::-1]
+    ]
     return {"result": result}