Spaces:

Ymokay
/

ToxiCheck

Sleeping

T0m4_ commited on Jun 14

Commit

6c4f586

unverified ·

Merge pull request #2 from Tbruand/feat/few-shot-model

feat(handler): fusion du modèle few-shot et sélection dynamique dans l’interface

- Ajout d’un modèle few-shot basé sur roberta
- Support de la sélection dynamique du modèle (zero-shot / few-shot)
- Affichage formaté Markdown avec scores
- Couverture testée par `pytest`

Files changed (4) hide show

app/handler.py +16 -7
app/interface.py +4 -1
models/few_shot.py +14 -0
tests/test_handler.py +11 -1

app/handler.py CHANGED Viewed

@@ -1,10 +1,19 @@
 from models.zero_shot import ZeroShotModel
-model = ZeroShotModel()
-def predict(text: str) -> str:
-    results = model.predict(text)
-    output = "### Résultat de la classification :\n\n"
-    for label, score in results:
-        output += f"- **{label}** : {score*100:.1f}%\n"
-    return output

 from models.zero_shot import ZeroShotModel
+from models.few_shot import FewShotModel
+zero_shot_model = ZeroShotModel()
+few_shot_model = FewShotModel()
+def predict(text: str, model_type: str = "zero-shot") -> str:
+    if model_type == "few-shot":
+        results = few_shot_model.predict(text)
+        output = "### Résultat de la classification (Few-Shot) :\n\n"
+        for label, score in results:
+            output += f"- **{label}** : {score*100:.1f}%\n"
+        return output
+    else:
+        results = zero_shot_model.predict(text)
+        output = "### Résultat de la classification (Zero-Shot) :\n\n"
+        for label, score in results:
+            output += f"- **{label}** : {score*100:.1f}%\n"
+        return output

app/interface.py CHANGED Viewed

@@ -4,7 +4,10 @@ from app.handler import predict
 def launch_app():
     iface = gr.Interface(
         fn=predict,
-        inputs="text",
         outputs="markdown",
         title="🧪 ToxiCheck",
         description="Entrez un texte pour détecter s'il est toxique. Résultat avec score de confiance pour chaque label."

 def launch_app():
     iface = gr.Interface(
         fn=predict,
+        inputs=[
+            gr.Textbox(label="Texte à analyser"),
+            gr.Dropdown(choices=["zero-shot", "few-shot"], label="Type de modèle", value="zero-shot")
+        ],
         outputs="markdown",
         title="🧪 ToxiCheck",
         description="Entrez un texte pour détecter s'il est toxique. Résultat avec score de confiance pour chaque label."

models/few_shot.py CHANGED Viewed

	@@ -0,0 +1,14 @@

+from models.base import BaseModel
+from transformers import pipeline
+class FewShotModel(BaseModel):
+    def __init__(self):
+        # On utilise un modèle préentraîné pour la classification de texte
+        self.classifier = pipeline("text-classification", model="textattack/roberta-base-rotten-tomatoes")
+    def predict(self, text: str) -> list[tuple[str, float]]:
+        result = self.classifier(text, truncation=True)[0]
+        label = result["label"].lower()
+        score = result["score"]
+        label = "non-toxique" if "pos" in label else "toxique"
+        return [(label, score)]

tests/test_handler.py CHANGED Viewed

@@ -14,4 +14,14 @@ def test_zero_shot_prediction_output():
     assert "### Résultat de la classification" in output
     assert "**toxique**" in output
     assert "**non-toxique**" in output
-    assert "%" in output

     assert "### Résultat de la classification" in output
     assert "**toxique**" in output
     assert "**non-toxique**" in output
+    assert "%" in output
+def test_few_shot_prediction_output():
+    from app.handler import predict
+    text = "Tu es un abruti fini"
+    output = predict(text, model_type="few-shot")
+    print("Résultat few-shot :", output)
+    assert "### Résultat de la classification" in output
+    assert "toxique" in output or "non-toxique" in output