|
🍷 Wine Quality Prediction - Proje Özeti
|
|
|
|
📌 Proje Amacı:
|
|
Kimyasal bileşenlerine göre kırmızı şarabın kalitesini sınıflandırmak.
|
|
|
|
🎯 Veri Seti:
|
|
- Kaynak: UCI Wine Quality Dataset
|
|
- Satır: 1599
|
|
- Sütun: 12 (11 özellik + 1 hedef: quality)
|
|
|
|
---
|
|
|
|
🏆 Önde Gelen Projelerde Uygulanan Yöntemler:
|
|
|
|
1. Veri Temizleme:
|
|
- Eksik değerler kontrol edildi.
|
|
- Aykırı değerler (outliers) IQR yöntemi ile çıkarıldı.
|
|
|
|
2. Özellik Mühendisliği:
|
|
- Korelasyon analizi ile düşük etkili özellikler çıkarıldı.
|
|
- Özellikler StandardScaler / MinMaxScaler ile ölçeklendirildi.
|
|
|
|
3. Hedef Dönüşümü:
|
|
- Kalite: 0–10 → Binary (Good/Bad) ya da 3 sınıf (Low/Medium/High)
|
|
|
|
4. Modelleme:
|
|
- Modeller: Random Forest, XGBoost, SVM, KNN
|
|
- Sınıf dengesizliği için SMOTE uygulandı.
|
|
- Doğruluk oranı %90+ modeller geliştirildi.
|
|
|
|
5. Uygulama ve Yayın:
|
|
- Flask/Streamlit ile arayüz
|
|
- Hugging Face / Render gibi platformlara model yükleme
|
|
|
|
---
|
|
|
|
✅ Bizim Gerçekleştirdiğimiz Adımlar:
|
|
|
|
1. Veri Yükleme ve EDA:
|
|
- Veri başarıyla yüklendi
|
|
- Korelasyon matrisi ve dağılımlar incelendi
|
|
|
|
2. Hedef Dönüşümü:
|
|
- quality → quality_label (low, medium, high) şeklinde 3 sınıfa ayrıldı
|
|
|
|
3. Modelleme:
|
|
- Veriler train/test olarak ayrıldı (stratify ile)
|
|
- StandardScaler ile ölçekleme yapıldı
|
|
- RandomForestClassifier ile eğitim yapıldı (%85+ başarı)
|
|
|
|
4. Model Kaydı:
|
|
- Model ve scaler `.pkl` dosyası olarak kaydedildi
|
|
|
|
5. Streamlit Uygulaması:
|
|
- Kullanıcı arayüzü ile tahmin aracı geliştirildi
|
|
|
|
6. Hugging Face:
|
|
- Model, scaler ve örnek giriş dosyaları yüklendi
|
|
- README.md ile birlikte açıklamalar eklendi
|
|
|
|
---
|
|
|
|
📊 Karşılaştırmalı Özet:
|
|
|
|
Aşama | Önde Gelen Projeler | Bizim Uygulama
|
|
--------------------|----------------------------------|------------------------------
|
|
Veri Temizleme | Aykırı değer çıkarıldı | Bu adım atlandı
|
|
Özellik Seçimi | Düşük etkili özellik çıkarıldı | Tüm özellikler kullanıldı
|
|
Hedef Dönüşümü | Binary ya da 3 sınıf | 3 sınıf (low, medium, high)
|
|
Modelleme | XGBoost, SVM, RF, KNN | Random Forest
|
|
Sınıf Dengeleme | SMOTE uygulandı | Uygulanmadı
|
|
Model Yayını | Flask, Render, HF | Streamlit + Hugging Face
|
|
|
|
---
|
|
|
|
🔍 Geliştirme Önerileri:
|
|
|
|
- Aykırı değer analizi eklenebilir
|
|
- Özellik seçimi iyileştirilebilir
|
|
- Alternatif modeller (XGBoost, SVM) denenebilir
|
|
- SMOTE gibi tekniklerle sınıf dengesi artırılabilir
|
|
|
|
|