RuAdaptGPT2Large / README.md
dwaru's picture
Update README.md
2a4787c verified
metadata
license: apache-2.0
language:
  - ru
metrics:
  - rouge
  - f1
base_model:
  - ai-forever/rugpt3large_based_on_gpt2
pipeline_tag: text-generation
library_name: transformers
tags:
  - text-adaptation
  - russian
  - gpt3
  - cefr
  - ruadapt
  - simplification

📝 RuAdapt-CEFR: Генерация адаптированного текста на русском 🇷🇺

RuAdapt-CEFR — это модель, разработанная студентами ДГТУ "Школа Икс", предназначенная для упрощения и адаптации текстов на основе их сложности.

🚀 Особенности модели:

✅ Основана на ai-forever/rugpt3large_based_on_gpt2
✅ Дообучена на RuAdapt и RuSimpleSentEval
✅ Позволяет адаптировать тексты под уровни CEFR (A1–C2)
✅ Генерирует тексты, сохраняя смысл оригинала, но упрощая лексику и грамматику

🎯 Использование

Модель принимает промпт следующего формата:

Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст: {target}

Пример запроса:

from transformers import pipeline

model = "ваш_юзернейм/ruadapt-cefr"
pipe = pipeline("text-generation", model=model)

text = "Научно-технический прогресс оказывает огромное влияние на современный мир."
level = "A2"

prompt = f"Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст:"
result = pipe(prompt, max_length=100)

print(result[0]["generated_text"])

🔗 Ссылка на Google Colab

📌 Открыть в Google Colab

📚 Датасеты

  • RuAdapt

  • RuSimpleSentEval

🎨 Области применения

  • Упрощение текстов для изучающих русский язык

  • Автоматическая адаптация текстов под CEFR

  • Образовательные и академические задачи