Modelo BERT para Classificação de Sentenças Jurídicas: Fato, Tese e Ruído

Este repositório disponibiliza um modelo BERT fine-tuned a partir do google-bert/bert-base-multilingual-cased, com o objetivo de classificar sentenças extraídas de processos judiciais em três categorias:

  • FATO: Sentenças que descrevem acontecimentos ou elementos objetivos do caso.
  • TESE: Sentenças que apresentam argumentos jurídicos ou fundamentos legais.
  • RUÍDO: Sentenças que não se enquadram como fato nem como tese (ex: trechos genéricos, introdutórios ou sem relevância jurídica direta).

Desenvolvido pela Diretoria de Inteligência Artificial, Ciência de Dados e Estatística do Tribunal de Justiça do Estado de Goiás (TJGO).

1. Instalação

Para instalar as dependências necessárias, execute o comando abaixo:

pip install transformers

2. Utilização do Modelo

from transformers import pipeline
text = """a empresa requerente atua..."""

classifier = pipeline("text-classification", model=r"DIACDE/BERT_FATO_TESE", return_all_scores=True, truncation=True)
print(classifier(text))

#[
#    {'label': 'FATO', 'score': 0.85},
#    {'label': 'TESE', 'score': 0.10}
#    {'label': 'RUIDO', 'score': 0.5}
#]
Downloads last month
886
Safetensors
Model size
178M params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for DIACDE/BERNA_BERT_FATO_TESE

Finetuned
(796)
this model