Spaces:

mediani
/

darija-aicc-api

Sleeping

App Files Files Community

mediani commited on Jun 10

Commit

b36a746

0 Parent(s):

feat: Fresh initial commit with LFS

Browse files

Files changed (12) hide show

.gitattributes +2 -0
.gitignore +28 -0
Dockerfile +24 -0
main.py +98 -0
mon_modele_darija_final/config.json +54 -0
mon_modele_darija_final/model.safetensors +3 -0
mon_modele_darija_final/special_tokens_map.json +7 -0
mon_modele_darija_final/tokenizer.json +0 -0
mon_modele_darija_final/tokenizer_config.json +58 -0
mon_modele_darija_final/training_args.bin +3 -0
mon_modele_darija_final/vocab.txt +0 -0
requirements.txt +14 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ *.safetensors filter=lfs diff=lfs merge=lfs -text
2	+ *.bin filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1,28 @@

+# ==================================
+# Environnements Virtuels Python
+# ==================================
+/venv/
+/.venv/
+/env/
+/.env/
+/ENV/
+# ==================================
+# Caches Python et fichiers compilés
+# ==================================
+__pycache__/
+*.py[cod]
+*$py.class
+# ==================================
+# Fichiers et dossiers des éditeurs
+# ==================================
+.vscode/
+.idea/
+# ==================================
+# Autres
+# ==================================
+*.egg-info/
+dist/
+build/

Dockerfile ADDED Viewed

	@@ -0,0 +1,24 @@

+# Étape 1: Utiliser une image de base Python officielle
+FROM python:3.9-slim
+# Étape 2: Définir le répertoire de travail dans le container
+WORKDIR /app
+# Étape 3: Copier le fichier des dépendances
+COPY requirements.txt requirements.txt
+# Étape 4: Installer les dépendances
+# --no-cache-dir pour garder l'image légère
+RUN pip install --no-cache-dir --upgrade pip
+RUN pip install --no-cache-dir -r requirements.txt
+# Étape 5: Copier tout le reste de votre projet dans le container
+# Cela inclut main.py et le dossier de votre modèle (ex: "marbert-darija-nlu-aicc")
+COPY . .
+# Étape 6: Exposer le port que votre API utilise
+EXPOSE 8000
+# Étape 7: La commande pour lancer l'API quand le container démarre
+# Uvicorn est lancé avec host="0.0.0.0" pour être accessible de l'extérieur du container
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "8000"]

main.py ADDED Viewed

	@@ -0,0 +1,98 @@

+# main.py
+import torch
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+from transformers import pipeline, AutoModelForSequenceClassification, AutoTokenizer
+from typing import Dict, Any
+# --- Configuration ---
+# Chemin vers votre modèle fine-tuné. Assurez-vous que ce dossier est correct.
+MODEL_PATH = "./mon_modele_darija_final"
+# --- Chargement du modèle (partie critique) ---
+# Cette partie est exécutée une seule fois, au démarrage du serveur.
+# C'est une bonne pratique pour éviter de recharger le modèle à chaque requête.
+try:
+    print("Chargement du tokenizer et du modèle MARBERT fine-tuné...")
+    # On spécifie le device (GPU si disponible, sinon CPU)
+    device = 0 if torch.cuda.is_available() else -1
+    # Création du pipeline de classification de texte de Hugging Face.
+    # C'est la manière la plus simple d'utiliser un modèle pour l'inférence.
+    nlu_pipeline = pipeline(
+        "text-classification",
+        model=MODEL_PATH,
+        tokenizer=MODEL_PATH,
+        device=device  # Utilise le GPU si disponible
+    )
+    print("Modèle chargé avec succès !")
+except Exception as e:
+    # Si le modèle ne peut pas être chargé, on lève une erreur claire.
+    print(f"Erreur critique lors du chargement du modèle: {e}")
+    nlu_pipeline = None
+# --- Définition de l'application FastAPI ---
+app = FastAPI(
+    title="API de NLU pour Darija Marocaine",
+    description="Une API pour classifier l'intention d'un texte en Darija, basée sur MARBERT.",
+    version="1.0.0"
+)
+# --- Définition des modèles de données (Pydantic) ---
+# C'est pour la validation automatique des requêtes.
+class TextInput(BaseModel):
+    """Modèle pour le corps de la requête de prédiction."""
+    text: str # Le champ doit s'appeler 'text'
+    # Exemple de requête JSON attendue: {"text": "3afak bghit nchouf lfactura"}
+class PredictionResponse(BaseModel):
+    """Modèle pour la réponse de l'API."""
+    intent: str
+    confidence: float
+# --- Définition des routes de l'API ---
+@app.get("/", tags=["Général"])
+def read_root() -> Dict[str, str]:
+    """Route principale qui retourne un message de bienvenue."""
+    return {"message": "Bienvenue sur l'API de NLU Darija. Utilisez le endpoint /predict pour faire une prédiction."}
+@app.get("/health", tags=["Général"])
+def health_check() -> Dict[str, str]:
+    """Route de 'health check' pour vérifier si le service est en ligne et le modèle chargé."""
+    if nlu_pipeline is None:
+        raise HTTPException(status_code=500, detail="Erreur: Le modèle NLP n'a pas pu être chargé.")
+    return {"status": "ok", "model_status": "loaded"}
+@app.post("/predict", response_model=PredictionResponse, tags=["Prédiction"])
+def predict_intent(request: TextInput) -> PredictionResponse:
+    """
+    Endpoint principal pour la prédiction d'intention.
+    Prend un texte en entrée et retourne l'intention prédite et son score de confiance.
+    """
+    if nlu_pipeline is None:
+        raise HTTPException(status_code=503, detail="Le service est indisponible car le modèle n'est pas chargé.")
+    if not request.text or not request.text.strip():
+        raise HTTPException(status_code=400, detail="Le champ 'text' ne peut pas être vide.")
+    try:
+        # Utilisation du pipeline pour faire la prédiction
+        prediction = nlu_pipeline(request.text, top_k=1)[0]
+        # Le pipeline retourne un dictionnaire avec 'label' et 'score'
+        # On renomme pour correspondre à notre modèle de réponse
+        intent = prediction['label']
+        confidence = prediction['score']
+        return PredictionResponse(intent=intent, confidence=confidence)
+    except Exception as e:
+        # Gestion d'erreurs inattendues pendant la prédiction
+        raise HTTPException(status_code=500, detail=f"Une erreur interne est survenue: {str(e)}")

mon_modele_darija_final/config.json ADDED Viewed

	@@ -0,0 +1,54 @@

+{
+  "architectures": [
+    "BertForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "classifier_dropout": null,
+  "directionality": "bidi",
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "consulter_solde",
+    "1": "declarer_panne",
+    "2": "demander_agent_humain",
+    "3": "hors_scope",
+    "4": "info_forfait",
+    "5": "reclamer_facture",
+    "6": "recuperer_mot_de_passe",
+    "7": "remerciements",
+    "8": "salutations"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "consulter_solde": 0,
+    "declarer_panne": 1,
+    "demander_agent_humain": 2,
+    "hors_scope": 3,
+    "info_forfait": 4,
+    "reclamer_facture": 5,
+    "recuperer_mot_de_passe": 6,
+    "remerciements": 7,
+    "salutations": 8
+  },
+  "layer_norm_eps": 1e-12,
+  "max_position_embeddings": 512,
+  "model_type": "bert",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_fc_size": 768,
+  "pooler_num_attention_heads": 12,
+  "pooler_num_fc_layers": 3,
+  "pooler_size_per_head": 128,
+  "pooler_type": "first_token_transform",
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.52.4",
+  "type_vocab_size": 2,
+  "use_cache": true,
+  "vocab_size": 100000
+}

mon_modele_darija_final/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:08322d4ab747d8187518d1d649c0bd36e7592fe4224f6b9885c3d2abe821d689
+size 651416604

mon_modele_darija_final/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

mon_modele_darija_final/tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

mon_modele_darija_final/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,58 @@

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "extra_special_tokens": {},
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

mon_modele_darija_final/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1bd13abe00ada94ffbf7c954ed271cc6b814dccf8eb05202ad4977182cdba021
+size 5304

mon_modele_darija_final/vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

requirements.txt ADDED Viewed

	@@ -0,0 +1,14 @@

+# ---- Core API Framework ----
+fastapi
+uvicorn
+# ---- Machine Learning Model & Pipeline ----
+# On ne spécifie pas la version de torch car il est préférable de l'installer séparément
+# ou de laisser pip résoudre la dépendance en fonction de la plateforme (CPU/GPU)
+# mais pour une image Docker déterministe, la figer est une option.
+torch==2.7.1
+transformers==4.52.4
+# ---- FastAPI Specific ----
+# Nécessaire pour gérer les formulaires et le téléversement de fichiers, bonne pratique.
+python-multipart