ru_custom_new_model / README.md
Dessan's picture
Update README.md
caced4f verified
---
language:
- ru
library_name: spacy
tags:
- code
widget:
- text: >-
Ровно 20 лет назад, 29 марта 2004 года, произошло очередное расширение НАТО:
к организации присоединись сразу семь стран бывшего социалистического
лагеря. В России этот шаг стал предметом серьезных обсуждений. Министр
иностранных дел России Сергей Лавров назвал решение «ошибочным шагом на пути
укрепления европейской безопасности». Суть позиции России заключалась в том,
чтобы параллельно расширению НАТО запустить переговорный процесс по созданию
новой архитектуры европейской безопасности. Однако сделать это не удалось:
вскоре случилось не менее масштабное увеличение числа стран-членов
Европейского союза (ЕС), а затем начались массовые протесты на Украине, в
результате которых к власти пришел сторонник евроатлантического курса Виктор
Ющенко. Произошел геополитический сдвиг. О том, почему НАТО решила
расширяться на восток после распада СССР и победы США в холодной войне и как
Россия изменила из-за этого свою внешнюю политику, «Ленте.ру» рассказал
заместитель директора Центра комплексных европейских и международных
исследований (ЦКЕМИ) Национального исследовательского университета «Высшая
школа экономики» Дмитрий Суслов.
pipeline_tag: token-classification
---
Russian pipeline optimized for CPU. Components: tok2vec, morphologizer, parser, senter, ner, attribute_ruler, lemmatizer.
| Feature | Description |
| --- | --- |
| **Name** | `ru_custom_new_model` |
| **Version** | `0.0.1` |
| **spaCy** | `>=3.7.0,<3.8.0` |
| **Default Pipeline** | `tok2vec`, `morphologizer`, `parser`, `attribute_ruler`, `lemmatizer`, `ner` |
| **Components** | `tok2vec`, `morphologizer`, `parser`, `senter`, `attribute_ruler`, `lemmatizer`, `ner` |
| **Vectors** | 500002 keys, 500002 unique vectors (300 dimensions) |
| **Sources** | n/a |
| **License** | `MIT` |
| **Author** | [Dessan](https://explosion.ai) |
### Label Scheme
<details>
<summary>View label scheme (905 labels for 3 components)</summary>
| Component | Labels |
| --- | --- |
| **`morphologizer`** | `Case=Nom\|Degree=Pos\|Number=Plur\|POS=ADJ`, `Animacy=Anim\|Case=Nom\|Gender=Masc\|Number=Plur\|POS=NOUN`, `Aspect=Perf\|Mood=Ind\|Number=Plur\|POS=VERB\|Tense=Pa>| **`parser`** | `ROOT`, `acl`, `acl:relcl`, `advcl`, `advmod`, `amod`, `appos`, `aux`, `aux:pass`, `case`, `cc`, `ccomp`, `compound`, `conj`, `cop`, `csubj`, `csubj:pass`, `dep`, `det`, >| **`ner`** | `BOMB`, `DATE`, `LOC`, `MONEY`, `ORG`, `PER`, `PRODUCT`, `VIRUS` |
</details>
### Accuracy
| Type | Score |
| --- | --- |
| `TOKEN_ACC` | 99.68 |
| `TOKEN_P` | 97.28 |
| `TOKEN_R` | 98.31 |
| `TOKEN_F` | 97.79 |
| `POS_ACC` | 98.93 |
| `MORPH_ACC` | 97.49 |
| `MORPH_MICRO_P` | 98.97 |
| `MORPH_MICRO_R` | 98.30 |
| `MORPH_MICRO_F` | 98.64 |
| `SENTS_P` | 99.87 |
| `SENTS_R` | 99.85 |
| `SENTS_F` | 99.86 |
| `DEP_UAS` | 96.22 |
| `DEP_LAS` | 95.12 |
| `TAG_ACC` | 98.93 |
| `LEMMA_ACC` | 0.00 |
| `ENTS_P` | 95.24 |
| `ENTS_R` | 95.35 |
| `ENTS_F` | 95.30 |