Update README.md
Browse files
README.md
CHANGED
|
@@ -24,11 +24,13 @@ metrics:
|
|
| 24 |
|
| 25 |
Bu model, Türkçe sorguları **"keyword"** ve **"semantic"** olmak üzere iki sınıfa ayırmak amacıyla eğitilmiş bir `BERT` tabanlı sıralı sınıflandırma (sequence classification) modelidir. Model, kısa metinlerin veya arama sorgularının niyetini (intent) belirlemede kullanılabilir.
|
| 26 |
|
| 27 |
-
|
|
|
|
| 28 |
|
| 29 |
Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha geniş anlamsal bağlam içeren** bir yapı mı taşıdığını tespit etmek için kullanılır. Bu sayede sorgular farklı işleme stratejilerine yönlendirilebilir.
|
| 30 |
|
| 31 |
-
|
|
|
|
| 32 |
|
| 33 |
- **Model mimarisi:** BERT (`dbmdz/bert-base-turkish-uncased`)
|
| 34 |
- **Eğitim verisi:** Özel olarak etiketlenmiş 2 sınıflı sorgu veri kümesi
|
|
@@ -36,9 +38,15 @@ Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha ge
|
|
| 36 |
- `keyword`: Daha çok başlık veya kısa anahtar ifadeler (örneğin: *Gece Gelen*, *Ozan Kılıç*)
|
| 37 |
- `semantic`: Daha açıklayıcı veya anlam yüklü ifadeler (örneğin: *2020 yılı dram filmleri*, *Bilim kurgu filmleri*)
|
| 38 |
|
| 39 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 40 |
|
| 41 |
-
Test kümesi üzerinde elde edilen sonuçlar:
|
| 42 |
|
| 43 |
```text
|
| 44 |
precision recall f1-score support
|
|
@@ -50,7 +58,7 @@ Test kümesi üzerinde elde edilen sonuçlar:
|
|
| 50 |
macro avg 0.84 0.88 0.86 638
|
| 51 |
weighted avg 0.93 0.93 0.93 638
|
| 52 |
```
|
| 53 |
-
## 🚀 Kullanım Örneği
|
| 54 |
|
| 55 |
```python
|
| 56 |
from transformers import AutoTokenizer, AutoModelForSequenceClassification
|
|
@@ -67,7 +75,7 @@ pred = torch.argmax(outputs.logits, dim=1).item()
|
|
| 67 |
labels = ["keyword", "semantic"]
|
| 68 |
print(f"Tahmin edilen sınıf: {labels[pred]}")
|
| 69 |
```
|
| 70 |
-
## Lisans
|
| 71 |
Bu model, araştırma ve eğitim amaçlı olarak paylaşılmıştır. Ticari kullanımlar için model sahibi ile iletişime geçiniz.
|
| 72 |
|
| 73 |
This model is shared for research and educational purposes. For commercial use, please contact the model owner.
|
|
|
|
| 24 |
|
| 25 |
Bu model, Türkçe sorguları **"keyword"** ve **"semantic"** olmak üzere iki sınıfa ayırmak amacıyla eğitilmiş bir `BERT` tabanlı sıralı sınıflandırma (sequence classification) modelidir. Model, kısa metinlerin veya arama sorgularının niyetini (intent) belirlemede kullanılabilir.
|
| 26 |
|
| 27 |
+
This model is a `BERT` based sequence classification model trained to classify Turkish queries into two classes, **“keyword ”** and **“semantic ”**. The model can be used to determine the intent of short texts or search queries.
|
| 28 |
+
## 🧾 Kullanım Senaryosu ( Usage Scenario)
|
| 29 |
|
| 30 |
Kullanıcıdan gelen bir sorgunun **anahtar kelime temelli mi**, yoksa **daha geniş anlamsal bağlam içeren** bir yapı mı taşıdığını tespit etmek için kullanılır. Bu sayede sorgular farklı işleme stratejilerine yönlendirilebilir.
|
| 31 |
|
| 32 |
+
It is used to determine whether a query from a user is **keyword-based** or contains a **broader semantic context**. In this way, queries can be directed to different processing strategies.
|
| 33 |
+
## 🧠 Model Detayları (Model Details)
|
| 34 |
|
| 35 |
- **Model mimarisi:** BERT (`dbmdz/bert-base-turkish-uncased`)
|
| 36 |
- **Eğitim verisi:** Özel olarak etiketlenmiş 2 sınıflı sorgu veri kümesi
|
|
|
|
| 38 |
- `keyword`: Daha çok başlık veya kısa anahtar ifadeler (örneğin: *Gece Gelen*, *Ozan Kılıç*)
|
| 39 |
- `semantic`: Daha açıklayıcı veya anlam yüklü ifadeler (örneğin: *2020 yılı dram filmleri*, *Bilim kurgu filmleri*)
|
| 40 |
|
| 41 |
+
- **Model architecture:** BERT (`dbmdz/bert-base-turkish-uncased`)
|
| 42 |
+
- **Training data:** Specially labeled 2-class query dataset
|
| 43 |
+
- **Tags:**
|
| 44 |
+
- `keyword`: Mostly titles or short key phrases (e.g. *Gece Gelen*, *Ozan Kılıç*)
|
| 45 |
+
- `semantic`: More descriptive or meaningful phrases (for example: *2020 drama movies*, *science fiction movies*)
|
| 46 |
+
|
| 47 |
+
## 📈 Model Başarımı (Model Success)
|
| 48 |
|
| 49 |
+
Test kümesi üzerinde elde edilen sonuçlar (Results obtained on the test set):
|
| 50 |
|
| 51 |
```text
|
| 52 |
precision recall f1-score support
|
|
|
|
| 58 |
macro avg 0.84 0.88 0.86 638
|
| 59 |
weighted avg 0.93 0.93 0.93 638
|
| 60 |
```
|
| 61 |
+
## 🚀 Kullanım Örneği (Usage)
|
| 62 |
|
| 63 |
```python
|
| 64 |
from transformers import AutoTokenizer, AutoModelForSequenceClassification
|
|
|
|
| 75 |
labels = ["keyword", "semantic"]
|
| 76 |
print(f"Tahmin edilen sınıf: {labels[pred]}")
|
| 77 |
```
|
| 78 |
+
## Lisans (License)
|
| 79 |
Bu model, araştırma ve eğitim amaçlı olarak paylaşılmıştır. Ticari kullanımlar için model sahibi ile iletişime geçiniz.
|
| 80 |
|
| 81 |
This model is shared for research and educational purposes. For commercial use, please contact the model owner.
|