File size: 2,439 Bytes
5afe60b
 
 
 
 
 
 
 
 
 
 
2a4787c
 
 
 
 
 
 
5afe60b
 
2a4787c
31cfddb
2a4787c
63220be
2a4787c
 
 
 
 
63220be
2a4787c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
---
license: apache-2.0
language:
- ru
metrics:
- rouge
- f1
base_model:
- ai-forever/rugpt3large_based_on_gpt2
pipeline_tag: text-generation
library_name: transformers
tags:
- text-adaptation
- russian
- gpt3
- cefr
- ruadapt
- simplification
---

# 📝 RuAdapt-CEFR: Генерация адаптированного текста на русском 🇷🇺  

**RuAdapt-CEFR** — это модель, разработанная студентами **ДГТУ "Школа Икс"**, предназначенная для упрощения и адаптации текстов на основе их сложности.  

### 🚀 Особенности модели:  
✅ Основана на **[ai-forever/rugpt3large_based_on_gpt2](https://huggingface.co/ai-forever/rugpt3large_based_on_gpt2)**  
✅ Дообучена на **RuAdapt** и **RuSimpleSentEval**  
✅ Позволяет адаптировать тексты под уровни **CEFR (A1–C2)**  
✅ Генерирует тексты, сохраняя смысл оригинала, но упрощая лексику и грамматику  

### 🎯 Использование  
Модель принимает промпт следующего формата:  

```
Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст: {target}
```

Пример запроса:  

```python
from transformers import pipeline

model = "ваш_юзернейм/ruadapt-cefr"
pipe = pipeline("text-generation", model=model)

text = "Научно-технический прогресс оказывает огромное влияние на современный мир."
level = "A2"

prompt = f"Адаптируй текст {text} на уровень по CEFR: {level} <eos> Адаптированный текст:"
result = pipe(prompt, max_length=100)

print(result[0]["generated_text"])
```

### 🔗 Ссылка на Google Colab
## 📌 [Открыть в Google Colab](https://colab.research.google.com/drive/1Cauh9O7HdkrEUs8NU69-zSkQwncS5wBG)

### 📚 Датасеты
* RuAdapt

* RuSimpleSentEval

### 🎨 Области применения
* Упрощение текстов для изучающих русский язык

* Автоматическая адаптация текстов под CEFR

* Образовательные и академические задачи