FLAN-T5 Base Fine-Tuned on CNN/DailyMail

This model is a fine-tuned version of google/flan-t5-base on the CNN/DailyMail dataset using the Hugging Face Transformers library.

📝 Task

Abstractive Summarization: Given a news article, generate a concise summary.

📊 Evaluation Results

The model was fine-tuned on 20,000 training samples and validated/tested on 2,000 samples. Evaluation was performed using ROUGE metrics:

Metric	Score
ROUGE-1	25.33
ROUGE-2	11.96
ROUGE-L	20.68
ROUGE-Lsum	23.81

📦 Usage

from transformers import T5Tokenizer, T5ForConditionalGeneration

model = T5ForConditionalGeneration.from_pretrained("AbdullahAlnemr1/flan-t5-summarizer")
tokenizer = T5Tokenizer.from_pretrained("AbdullahAlnemr1/flan-t5-summarizer")

input_text = "summarize: The US president met with the Senate to discuss..."
inputs = tokenizer(input_text, return_tensors="pt", max_length=512, truncation=True)

summary_ids = model.generate(inputs["input_ids"], max_length=128, num_beams=4, early_stopping=True)
print(tokenizer.decode(summary_ids[0], skip_special_tokens=True))

Downloads last month: 3

Safetensors

Model size

0.2B params

Tensor type

F32

Model tree for AbdullahAlnemr1/flan-t5-summarizer

Base model

google/flan-t5-base

Finetuned

(909)

this model

Dataset used to train AbdullahAlnemr1/flan-t5-summarizer

Spaces using AbdullahAlnemr1/flan-t5-summarizer 2

Evaluation results

Rouge-1 on CNN/DailyMail
self-reported

25.330
Rouge-2 on CNN/DailyMail
self-reported

11.960
Rouge-L on CNN/DailyMail
self-reported

20.680