Spaces:

Euryeth
/

LLM_Ariphes

Runtime error

App Files Files Community

Euryeth commited on Jun 8

Commit

57d8e73

verified ·

1 Parent(s): 3ce5700

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -54

app.py CHANGED Viewed

@@ -1,61 +1,20 @@
 from ctransformers import AutoModelForCausalLM
 import os
-# Configure cache
 os.environ['HF_HOME'] = '/tmp/cache'
-# Load GGUF model
-model = AutoModelForCausalLM.from_pretrained(
-    "mradermacher/Ninja-v1-NSFW-RP-GGUF",
-    model_file="ninja-v1.Q5_K_M.gguf",  # Medium quantization
-    model_type="llama",
-    gpu_layers=0,  # CPU only
-    context_length=4096  # Max context size
-)
-def generate_chat_completion(messages, max_tokens=1080, temperature=0.8):
-    """Generate chat response in OpenAI format"""
-    # Format messages as prompt
-    prompt = "\n".join(f"{m['role']}: {m['content']}" for m in messages)
-    prompt += "\nassistant:"
-    # Generate response
-    response = model(
-        prompt,
-        max_new_tokens=max_tokens,
-        temperature=temperature,
-        stop=["</s>", "user:", "system:"],
-        stream=False
-    )
-    return {
-        "id": f"chatcmpl-{os.urandom(8).hex()}",
-        "object": "chat.completion",
-        "created": int(time.time()),
-        "model": "Ninja-v1-NSFW-RP",
-        "choices": [{
-            "index": 0,
-            "message": {
-                "role": "assistant",
-                "content": response
-            },
-            "finish_reason": "stop"
-        }],
-        "usage": {
-            "prompt_tokens": len(prompt.split()),
-            "completion_tokens": len(response.split()),
-            "total_tokens": len(prompt.split()) + len(response.split())
-        }
-    }
-    from transformers import AutoTokenizer
-# Add after model loading
-tokenizer = AutoTokenizer.from_pretrained(
-    "mradermacher/Ninja-v1-NSFW-RP-GGUF",
-    use_fast=False
 )
-# In generate_chat_completion():
-prompt_tokens = len(tokenizer.encode(prompt))
-completion_tokens = len(tokenizer.encode(response))

+from huggingface_hub import hf_hub_download
 from ctransformers import AutoModelForCausalLM
 import os
 os.environ['HF_HOME'] = '/tmp/cache'
+# Download model explicitly
+model_path = hf_hub_download(
+    repo_id="mradermacher/Ninja-v1-NSFW-RP-GGUF",
+    filename="ninja-v1.Q5_K_M.gguf",
+    revision="main"
 )
+# Load from local path
+model = AutoModelForCausalLM.from_pretrained(
+    model_path,  # Use downloaded path
+    model_type="llama",
+    gpu_layers=0,
+    context_length=4096
+)