| --- |
| license: apache-2.0 |
| language: |
| - ru |
| metrics: |
| - rouge |
| - f1 |
| base_model: |
| - ai-forever/rugpt3large_based_on_gpt2 |
| pipeline_tag: text-generation |
| library_name: transformers |
| tags: |
| - text-adaptation |
| - russian |
| - gpt3 |
| - cefr |
| - ruadapt |
| - simplification |
| --- |
| |
| # 📝 RuAdapt-CEFR: Генерация адаптированного текста на русском 🇷🇺 |
|
|
| **RuAdapt-CEFR** — это модель, разработанная студентами **ДГТУ "Школа Икс"**, предназначенная для упрощения и адаптации текстов на основе их сложности. |
|
|
| ### 🚀 Особенности модели: |
| ✅ Основана на **[ai-forever/rugpt3large_based_on_gpt2](https://huggingface.co/ai-forever/rugpt3large_based_on_gpt2)** |
| ✅ Дообучена на **RuAdapt** и **RuSimpleSentEval** |
| ✅ Позволяет адаптировать тексты под уровни **CEFR (A1–C2)** |
| ✅ Генерирует тексты, сохраняя смысл оригинала, но упрощая лексику и грамматику |
|
|
| ### 🎯 Использование |
| Модель принимает промпт следующего формата: |
|
|
| ``` |
| Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст: {target} |
| ``` |
|
|
| Пример запроса: |
|
|
| ```python |
| from transformers import pipeline |
| |
| model = "ваш_юзернейм/ruadapt-cefr" |
| pipe = pipeline("text-generation", model=model) |
| |
| text = "Научно-технический прогресс оказывает огромное влияние на современный мир." |
| level = "A2" |
| |
| prompt = f"Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст:" |
| result = pipe(prompt, max_length=100) |
| |
| print(result[0]["generated_text"]) |
| ``` |
|
|
| ### 🔗 Ссылка на Google Colab |
| ## 📌 [Открыть в Google Colab](https://colab.research.google.com/drive/1Cauh9O7HdkrEUs8NU69-zSkQwncS5wBG) |
|
|
| ### 📚 Датасеты |
| * RuAdapt |
|
|
| * RuSimpleSentEval |
|
|
| ### 🎨 Области применения |
| * Упрощение текстов для изучающих русский язык |
|
|
| * Автоматическая адаптация текстов под CEFR |
|
|
| * Образовательные и академические задачи |