BhashiniSpace_Text_gemma

Runtime error

FlawedLLM commited on May 22, 2024

Commit

eac88f2

verified ·

1 Parent(s): 9d7277a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,17 +1,17 @@
 import re
 import spaces
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 import torch
-from peft import PeftModel, PeftConfig
-tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/BhashiniLLM")
-quantization_config = BitsAndBytesConfig(
-        load_in_4bit=True,
-        bnb_4bit_use_double_quant=True,
-        bnb_4bit_quant_type="nf4",
-        bnb_4bit_compute_dtype=torch.float16)
 # model = AutoModelForCausalLM.from_pretrained("FlawedLLM/BhashiniLLM",
 #                                              device_map="auto",
 #                                              quantization_config=quantization_config,
@@ -34,9 +34,7 @@ quantization_config = BitsAndBytesConfig(
-config = PeftConfig.from_pretrained("FlawedLLM/BhashiniLLM")
-base_model = AutoModelForCausalLM.from_pretrained("unsloth/llama-3-8b-bnb-4bit",  device_map='auto', quantization_config=quantization_config)
-model = PeftModel.from_pretrained(base_model, "FlawedLLM/BhashiniLLM")
 @spaces.GPU(duration=300)

 import re
 import spaces
 import gradio as gr
+from transformers import AutoTokenizer, AutoModel, BitsAndBytesConfig
 import torch
+# from peft import PeftModel, PeftConfig
+tokenizer = AutoTokenizer.from_pretrained("FlawedLLM/Bhashini")
+# quantization_config = BitsAndBytesConfig(
+#         load_in_4bit=True,
+#         bnb_4bit_use_double_quant=True,
+#         bnb_4bit_quant_type="nf4",
+#         bnb_4bit_compute_dtype=torch.float16)
 # model = AutoModelForCausalLM.from_pretrained("FlawedLLM/BhashiniLLM",
 #                                              device_map="auto",
 #                                              quantization_config=quantization_config,
+model = AutoModel.from_pretrained("FlawedLLM/Bhashini",device_map='auto')
 @spaces.GPU(duration=300)