metadata

library_name: transformers
license: mit
language:
  - en
metrics:
  - f1
  - precision
  - recall
base_model:
  - microsoft/codebert-base
pipeline_tag: text-classification

CodeBERT base for classifying smell documentation (multi-label)

This model classifies smell documentation as 'fragmented', 'tangled', 'excessive', 'bloated' or 'lazy'.

Developed by: Fabian C. Peña, Steffen Herbold
Finetuned from: microsoft/codebert-base
Replication kit: https://github.com/aieng-lab/senlp-benchmark
Language: English
License: MIT

Citation

@misc{pena2025benchmark,
  author    = {Fabian Peña and Steffen Herbold},
  title     = {Evaluating Large Language Models on Non-Code Software Engineering Tasks},
  year      = {2025}
}