Danil
commited on
Commit
·
e599313
1
Parent(s):
89856b8
Create README.md
Browse files
README.md
ADDED
|
@@ -0,0 +1,48 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
language:
|
| 3 |
+
- ru
|
| 4 |
+
license: apache-2.0
|
| 5 |
+
inference:
|
| 6 |
+
parameters:
|
| 7 |
+
top_p: 0.9
|
| 8 |
+
widget:
|
| 9 |
+
- text: "В России может появиться новый штамм коронавируса «омикрон», что может привести к подъему заболеваемости в январе, заявил доцент кафедры инфекционных болезней РУДН Сергей Вознесенский. Он отметил, что вариант «дельта» вызывал больше летальных случаев, чем омикрон, именно на фоне «дельты» была максимальная летальность."
|
| 10 |
+
example_title: "Коронавирус"
|
| 11 |
+
- text: "Начальника штаба обороны Великобритании адмирала Тони Радакина заставили имитировать активность во время визита в ангар с тяжелым вооружением, сообщила британская пресса. В приказе говорилось, что военнослужащим было велено подбегать к автомобилям, открывать все люки, затворы, листать руководство по эксплуатации и осматриваться машины, будто проводится функциональный тест для обеспечения правильной работы оборудования."
|
| 12 |
+
example_title: "Британия"
|
| 13 |
+
- text: "Для воспроизведения музыки достаточно нажимать на кнопки клавиатуры. Каждой клавише соответствует определенный семпл — есть маракасы и футуристичные звуки, напоминающие выстрелы бластеров. Из всего многообразия можно формировать собственные паттерны и наблюдать за визуализацией с анимированными геометрическими фигурами. Что интересно, нажатием клавиши пробел можно полностью переменить оформление, цвета на экране и звучание семплов."
|
| 14 |
+
example_title: "Технологии"
|
| 15 |
+
---
|
| 16 |
+
## keyT5. Base (small) version
|
| 17 |
+
|
| 18 |
+
Example usage (the code returns a list with keywords. duplicates are possible):
|
| 19 |
+
```python
|
| 20 |
+
from itertools import groupby
|
| 21 |
+
import torch
|
| 22 |
+
from transformers import T5ForConditionalGeneration, T5Tokenizer
|
| 23 |
+
|
| 24 |
+
model_name = "0x7194633/keyt5-base"
|
| 25 |
+
tokenizer = T5Tokenizer.from_pretrained(model_name)
|
| 26 |
+
model = T5ForConditionalGeneration.from_pretrained(model_name)
|
| 27 |
+
|
| 28 |
+
def generate(text, **kwargs):
|
| 29 |
+
inputs = tokenizer(text, return_tensors='pt')
|
| 30 |
+
with torch.no_grad():
|
| 31 |
+
hypotheses = model.generate(**inputs, num_beams=5, **kwargs)
|
| 32 |
+
s = tokenizer.decode(hypotheses[0], skip_special_tokens=True)
|
| 33 |
+
s = s.replace('; ', ';').replace(' ;', ';').lower().split(';')
|
| 34 |
+
s = [el for el, _ in groupby(s)]
|
| 35 |
+
return s
|
| 36 |
+
|
| 37 |
+
|
| 38 |
+
article = """Reuters сообщил об отмене 3,6 тыс. авиарейсов из-за «омикрона» и погоды
|
| 39 |
+
Наибольшее число отмен авиарейсов 2 января пришлось на американские авиакомпании
|
| 40 |
+
SkyWest и Southwest, у каждой — более 400 отмененных рейсов. При этом среди
|
| 41 |
+
отмененных 2 января авиарейсов — более 2,1 тыс. рейсов в США. Также свыше 6400
|
| 42 |
+
рейсов были задержаны."""
|
| 43 |
+
|
| 44 |
+
|
| 45 |
+
print(generate(article, top_p=1.0, max_length=64))
|
| 46 |
+
|
| 47 |
+
# ['лабораторная диагностика', 'панкреатит', 'профилактика', 'профилактика заболеваний', 'научно-популярное', 'биотехнологии', 'здоровье']
|
| 48 |
+
```
|