Spaces:

cody82
/

bot_innopolis

Running

cody82 commited on Jul 21

Commit

9c601ea

verified ·

1 Parent(s): de6cced

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,28 +1,25 @@
 import torch
-import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM, AutoConfig
-model_path = "cody82/unitrip"  # путь к локальной модели
-config = AutoConfig.from_pretrained(model_path, local_files_only=True)
-tokenizer = AutoTokenizer.from_pretrained(model_path, local_files_only=True)
-model = AutoModelForCausalLM.from_pretrained(
-    model_path,
-    config=config,
-    local_files_only=False,
-    torch_dtype=torch.float32,
-    device_map="auto" if torch.cuda.is_available() else None,
-)
 system_message = "Ты — умный помощник по Университету Иннополис."
-def respond(message, history=None):
-    if history is None:
-        history = []
-    prompt = f"{system_message}\nUser: {message}\nAssistant:"
-    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
@@ -33,11 +30,6 @@ def respond(message, history=None):
             use_cache=True,
         )
-    generated_tokens = outputs[0][inputs["input_ids"].shape[1]:]
-    answer = tokenizer.decode(generated_tokens, skip_special_tokens=True).strip()
-    history.append((message, answer))
-    return history
-chat = gr.ChatInterface(fn=respond, title="Innopolis Assistant")
-chat.launch()

 import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
+model_id = "cody82/unitrip"  # или другой ID модели с Huggingface
+tokenizer = AutoTokenizer.from_pretrained(model_id)  # без local_files_only
+model = AutoModelForCausalLM.from_pretrained(model_id)  # без local_files_only
+device = "cuda" if torch.cuda.is_available() else "cpu"
+model.to(device)
 system_message = "Ты — умный помощник по Университету Иннополис."
+while True:
+    user_input = input("🧑 Вопрос: ").strip()
+    if user_input.lower() in ["exit", "выход", "quit"]:
+        break
+    prompt = f"{system_message}\nUser: {user_input}\nAssistant:"
+    inputs = tokenizer(prompt, return_tensors="pt").to(device)
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
             use_cache=True,
         )
+    generated = outputs[0][inputs["input_ids"].shape[1]:]
+    answer = tokenizer.decode(generated, skip_special_tokens=True)
+    print(f"🤖 Ответ: {answer.strip()}\n")