MBAL_chatbot

Sleeping

ngcanh commited on Jul 15

Commit

1a01d56

verified ·

1 Parent(s): 12fcd70

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -27,7 +27,7 @@ TOKEN=os.getenv('HF_TOKEN')
 subprocess.run(["huggingface-cli", "login", "--token", TOKEN, "--add-to-git-credential"])
 ######
 # set this key as an environment variable
-os.environ["HUGGINGFACEHUB_API_TOKEN"] = st.secrets["HF_TOKEN"]
 # Initialize tokenizer
@@ -37,11 +37,11 @@ def load_model():
     MODEL_NAME = "google/gemma-2b-it"
     model = AutoModelForCausalLM.from_pretrained(
-        MODEL_NAME,
         # quantization_config=nf4_config, # add config
         # torch_dtype=torch.bfloat16, # save memory using float16
         # low_cpu_mem_usage=True,
-        token=st.secrets["HF_TOKEN"],
     ).to("cuda")
     tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)

 subprocess.run(["huggingface-cli", "login", "--token", TOKEN, "--add-to-git-credential"])
 ######
 # set this key as an environment variable
+os.environ["HF_TOKEN"] = st.secrets["HF_TOKEN"]
 # Initialize tokenizer
     MODEL_NAME = "google/gemma-2b-it"
     model = AutoModelForCausalLM.from_pretrained(
+        MODEL_NAME,\
         # quantization_config=nf4_config, # add config
         # torch_dtype=torch.bfloat16, # save memory using float16
         # low_cpu_mem_usage=True,
+        # token=st.secrets["HF_TOKEN"],
     ).to("cuda")
     tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)