Spaces:

UcsTurkey
/

flare

Paused

App Files Files Community

ciyidogan commited on May 26

Commit

01ac332

verified ·

1 Parent(s): f7d2bfe

Update intent_utils.py

Browse files

Files changed (1) hide show

intent_utils.py +63 -4

intent_utils.py CHANGED Viewed

@@ -5,7 +5,14 @@ import shutil
 import re
 import traceback
 from datasets import Dataset
-from transformers import AutoTokenizer, AutoModelForSequenceClassification, Trainer, TrainingArguments, default_data_collator, AutoConfig
 from log import log
 from core import INTENT_MODELS
@@ -62,7 +69,7 @@ def background_training(project_name, intents, model_id, output_path, confidence
             model=model,
             args=TrainingArguments(output_path, per_device_train_batch_size=4, num_train_epochs=3, logging_steps=10, save_strategy="no", report_to=[]),
             train_dataset=tokenized,
-            data_collator=default_data_collator
         )
         trainer.train()
@@ -97,10 +104,62 @@ def background_training(project_name, intents, model_id, output_path, confidence
         INTENT_MODELS[project_name] = {
             "model": model,
             "tokenizer": tokenizer,
-            "label2id": label2id
         }
         log(f"✅ Intent eğitimi tamamlandı ve '{project_name}' modeli yüklendi.")
     except Exception as e:
         log(f"❌ Intent eğitimi hatası: {e}")
-        traceback.print_exc()

 import re
 import traceback
 from datasets import Dataset
+from transformers import (
+    AutoTokenizer,
+    AutoModelForSequenceClassification,
+    Trainer,
+    TrainingArguments,
+    default_data_collator,
+    AutoConfig,
+)
 from log import log
 from core import INTENT_MODELS
             model=model,
             args=TrainingArguments(output_path, per_device_train_batch_size=4, num_train_epochs=3, logging_steps=10, save_strategy="no", report_to=[]),
             train_dataset=tokenized,
+            data_collator=default_data_collator,
         )
         trainer.train()
         INTENT_MODELS[project_name] = {
             "model": model,
             "tokenizer": tokenizer,
+            "label2id": label2id,
         }
         log(f"✅ Intent eğitimi tamamlandı ve '{project_name}' modeli yüklendi.")
     except Exception as e:
         log(f"❌ Intent eğitimi hatası: {e}")
+        traceback.print_exc()
+def extract_parameters(variables_list, user_input):
+    for pattern in variables_list:
+        regex = re.sub(r"(\w+):\{(.+?)\}", r"(?P<\1>.+?)", pattern)
+        match = re.match(regex, user_input)
+        if match:
+            return [{"key": k, "value": v} for k, v in match.groupdict().items()]
+    return []
+def resolve_placeholders(text: str, session: dict, variables: dict) -> str:
+    def replacer(match):
+        full = match.group(1)
+        try:
+            if full.startswith("variables."):
+                key = full.split(".", 1)[1]
+                return str(variables.get(key, f"{{{full}}}"))
+            elif full.startswith("session."):
+                key = full.split(".", 1)[1]
+                return str(session.get("variables", {}).get(key, f"{{{full}}}"))
+            elif full.startswith("auth_tokens."):
+                parts = full.split(".")
+                if len(parts) == 3:
+                    intent, token_type = parts[1], parts[2]
+                    return str(session.get("auth_tokens", {}).get(intent, {}).get(token_type, f"{{{full}}}"))
+                else:
+                    return f"{{{full}}}"
+            else:
+                return f"{{{full}}}"
+        except Exception:
+            return f"{{{full}}}"
+    return re.sub(r"\{([^{}]+)\}", replacer, text)
+def validate_variable_formats(variables, variable_format_map, data_formats):
+    errors = {}
+    for var_name, format_name in variable_format_map.items():
+        value = variables.get(var_name)
+        if value is None:
+            continue
+        format_def = data_formats.get(format_name)
+        if not format_def:
+            continue
+        if "valid_options" in format_def:
+            if value not in format_def["valid_options"]:
+                errors[var_name] = format_def.get("error_message", f"{var_name} değeri geçersiz.")
+        elif "pattern" in format_def:
+            if not re.fullmatch(format_def["pattern"], value):
+                errors[var_name] = format_def.get("error_message", f"{var_name} formatı geçersiz.")
+    return len(errors) == 0, errors