File size: 3,991 Bytes
5a2fec9
 
 
 
6f10818
 
 
caced4f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
cce902c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
---
language:
- ru
library_name: spacy
tags:
- code
widget:
- text: >-
    Ровно 20 лет назад, 29 марта 2004 года, произошло очередное расширение НАТО:
    к организации присоединись сразу семь стран бывшего социалистического
    лагеря. В России этот шаг стал предметом серьезных обсуждений. Министр
    иностранных дел России Сергей Лавров назвал решение «ошибочным шагом на пути
    укрепления европейской безопасности». Суть позиции России заключалась в том,
    чтобы параллельно расширению НАТО запустить переговорный процесс по созданию
    новой архитектуры европейской безопасности. Однако сделать это не удалось:
    вскоре случилось не менее масштабное увеличение числа стран-членов
    Европейского союза (ЕС), а затем начались массовые протесты на Украине, в
    результате которых к власти пришел сторонник евроатлантического курса Виктор
    Ющенко. Произошел геополитический сдвиг. О том, почему НАТО решила
    расширяться на восток после распада СССР и победы США в холодной войне и как
    Россия изменила из-за этого свою внешнюю политику, «Ленте.ру» рассказал
    заместитель директора Центра комплексных европейских и международных
    исследований (ЦКЕМИ) Национального исследовательского университета «Высшая
    школа экономики» Дмитрий Суслов.
pipeline_tag: token-classification
---

Russian pipeline optimized for CPU. Components: tok2vec, morphologizer, parser, senter, ner, attribute_ruler, lemmatizer.

| Feature | Description |
| --- | --- |
| **Name** | `ru_custom_new_model` |
| **Version** | `0.0.1` |
| **spaCy** | `>=3.7.0,<3.8.0` |
| **Default Pipeline** | `tok2vec`, `morphologizer`, `parser`, `attribute_ruler`, `lemmatizer`, `ner` |
| **Components** | `tok2vec`, `morphologizer`, `parser`, `senter`, `attribute_ruler`, `lemmatizer`, `ner` |
| **Vectors** | 500002 keys, 500002 unique vectors (300 dimensions) |
| **Sources** | n/a |
| **License** | `MIT` |
| **Author** | [Dessan](https://explosion.ai) |

### Label Scheme

<details>

<summary>View label scheme (905 labels for 3 components)</summary>

| Component | Labels |
| --- | --- |
| **`morphologizer`** | `Case=Nom\|Degree=Pos\|Number=Plur\|POS=ADJ`, `Animacy=Anim\|Case=Nom\|Gender=Masc\|Number=Plur\|POS=NOUN`, `Aspect=Perf\|Mood=Ind\|Number=Plur\|POS=VERB\|Tense=Pa>| **`parser`** | `ROOT`, `acl`, `acl:relcl`, `advcl`, `advmod`, `amod`, `appos`, `aux`, `aux:pass`, `case`, `cc`, `ccomp`, `compound`, `conj`, `cop`, `csubj`, `csubj:pass`, `dep`, `det`, >| **`ner`** | `BOMB`, `DATE`, `LOC`, `MONEY`, `ORG`, `PER`, `PRODUCT`, `VIRUS` |

</details>

### Accuracy

| Type | Score |
| --- | --- |
| `TOKEN_ACC` | 99.68 |
| `TOKEN_P` | 97.28 |
| `TOKEN_R` | 98.31 |
| `TOKEN_F` | 97.79 |
| `POS_ACC` | 98.93 |
| `MORPH_ACC` | 97.49 |
| `MORPH_MICRO_P` | 98.97 |
| `MORPH_MICRO_R` | 98.30 |
| `MORPH_MICRO_F` | 98.64 |
| `SENTS_P` | 99.87 |
| `SENTS_R` | 99.85 |
| `SENTS_F` | 99.86 |
| `DEP_UAS` | 96.22 |
| `DEP_LAS` | 95.12 |
| `TAG_ACC` | 98.93 |
| `LEMMA_ACC` | 0.00 |
| `ENTS_P` | 95.24 |
| `ENTS_R` | 95.35 |
| `ENTS_F` | 95.30 |