File size: 2,439 Bytes
5afe60b 2a4787c 5afe60b 2a4787c 31cfddb 2a4787c 63220be 2a4787c 63220be 2a4787c |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 |
---
license: apache-2.0
language:
- ru
metrics:
- rouge
- f1
base_model:
- ai-forever/rugpt3large_based_on_gpt2
pipeline_tag: text-generation
library_name: transformers
tags:
- text-adaptation
- russian
- gpt3
- cefr
- ruadapt
- simplification
---
# 📝 RuAdapt-CEFR: Генерация адаптированного текста на русском 🇷🇺
**RuAdapt-CEFR** — это модель, разработанная студентами **ДГТУ "Школа Икс"**, предназначенная для упрощения и адаптации текстов на основе их сложности.
### 🚀 Особенности модели:
✅ Основана на **[ai-forever/rugpt3large_based_on_gpt2](https://huggingface.co/ai-forever/rugpt3large_based_on_gpt2)**
✅ Дообучена на **RuAdapt** и **RuSimpleSentEval**
✅ Позволяет адаптировать тексты под уровни **CEFR (A1–C2)**
✅ Генерирует тексты, сохраняя смысл оригинала, но упрощая лексику и грамматику
### 🎯 Использование
Модель принимает промпт следующего формата:
```
Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст: {target}
```
Пример запроса:
```python
from transformers import pipeline
model = "ваш_юзернейм/ruadapt-cefr"
pipe = pipeline("text-generation", model=model)
text = "Научно-технический прогресс оказывает огромное влияние на современный мир."
level = "A2"
prompt = f"Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст:"
result = pipe(prompt, max_length=100)
print(result[0]["generated_text"])
```
### 🔗 Ссылка на Google Colab
## 📌 [Открыть в Google Colab](https://colab.research.google.com/drive/1Cauh9O7HdkrEUs8NU69-zSkQwncS5wBG)
### 📚 Датасеты
* RuAdapt
* RuSimpleSentEval
### 🎨 Области применения
* Упрощение текстов для изучающих русский язык
* Автоматическая адаптация текстов под CEFR
* Образовательные и академические задачи |