Spaces:

MFBDA
/

classificador-criticidade-compras

Running

MFBDA commited on Feb 12

Commit

8d08465

verified ·

1 Parent(s): e6b5f03

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,33 +1,28 @@
-import gradio as gr
-from transformers import pipeline
-# Carregar um modelo em português
-classifier = pipeline("text-classification", model="neuralmind/bert-base-portuguese-cased")
-# Função para classificar a criticidade da compra
-def classificar_criticidade(descricao):
-    resultado = classifier(descricao)[0]
-    label = resultado['label']
-    score = resultado['score']
-    # Mapear a saída do modelo para criticidade
-    if label == "LABEL_0":  # Suponha que LABEL_0 seja "Baixa"
-        return f"Criticidade: Baixa (Confiança: {score:.2f})"
-    elif label == "LABEL_1":  # Suponha que LABEL_1 seja "Média"
-        return f"Criticidade: Média (Confiança: {score:.2f})"
-    elif label == "LABEL_2":  # Suponha que LABEL_2 seja "Alta"
-        return f"Criticidade: Alta (Confiança: {score:.2f})"
-    else:
-        return "Não foi possível determinar a criticidade."
-# Interface Gradio
-interface = gr.Interface(
-    fn=classificar_criticidade,
-    inputs=gr.Textbox(lines=2, placeholder="Descreva a compra..."),
-    outputs="text",
-    title="Classificador de Criticidade de Compra",
-    description="Insira a descrição da compra para receber uma classificação de criticidade."
 )
-# Iniciar a interface
-interface.launch()

+import pandas as pd
+from sklearn.model_selection import train_test_split
+from transformers import AutoTokenizer
+# Carregar os dados
+df = pd.read_csv("files/dados.csv")
+# Dividir os dados em treino e teste
+train_texts, test_texts, train_labels, test_labels = train_test_split(
+    df["descricao"].tolist(),
+    df["criticidade"].tolist(),
+    test_size=0.2,
+    random_state=42
 )
+# Mapear rótulos para números
+label_map = {"Baixa": 0, "Media": 1, "Alta": 2}
+train_labels = [label_map[label] for label in train_labels]
+test_labels = [label_map[label] for label in test_labels]
+# Carregar o tokenizer do modelo pré-treinado
+tokenizer = AutoTokenizer.from_pretrained("neuralmind/bert-base-portuguese-cased")
+# Tokenizar os textos
+train_encodings = tokenizer(train_texts, truncation=True, padding=True, max_length=128)
+test_encodings = tokenizer(test_texts, truncation=True, padding=True, max_length=128)
+# Restante do código para criar o dataset e fine-tuning...