Chitti-v2

Running

App Files Files Community

Dhahlan2000 commited on Jun 9, 2024

Commit

bbfdd64

verified ·

1 Parent(s): d12a493

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -7

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ import torch
 from huggingface_hub import InferenceClient
 import os
-access_token = os.environ["TOKEN"]
 # Set up device
 device = "cuda" if torch.cuda.is_available() else "cpu"
@@ -48,9 +48,9 @@ def transliterate_to_sinhala(text):
     return transliterate.process('Velthuis', 'Sinhala', text)
 # Load conversation model
-conv_model_name = "google/gemma-2b-it"  # Use GPT-2 instead of the gated model
-tokenizer = AutoTokenizer.from_pretrained(conv_model_name, trust_remote_code=True, token = access_token)
-model = AutoModelForCausalLM.from_pretrained(conv_model_name, trust_remote_code=True, token = access_token, torch_dtype=torch.bfloat16).to(device)
 # pipe1 = pipeline("text-generation", model="TinyLlama/TinyLlama-1.1B-Chat-v1.0").to(device)
 # model = "tiiuae/falcon-7b-instruct"
@@ -70,6 +70,8 @@ model = AutoModelForCausalLM.from_pretrained(conv_model_name, trust_remote_code=
 # client = InferenceClient("google/gemma-2b-it")
 def conversation_predict(text):
     # return client.text_generation(text, return_full_text=False)
     # pipe = pipeline(
     # "text-generation",
@@ -85,9 +87,9 @@ def conversation_predict(text):
     # output = pipe(text, **generation_args)
     # return output[0]['generated_text']
-    input_ids = tokenizer(text, return_tensors="pt")
-    outputs = model.generate(**input_ids)
-    return tokenizer.decode(outputs[0])
     # outputs = pipe1(text, max_new_tokens=256, temperature=0.7, top_k=50, top_p=0.95)
     # return outputs[0]["generated_text"]

 from huggingface_hub import InferenceClient
 import os
+# access_token = os.environ["TOKEN"]
 # Set up device
 device = "cuda" if torch.cuda.is_available() else "cpu"
     return transliterate.process('Velthuis', 'Sinhala', text)
 # Load conversation model
+# conv_model_name = "google/gemma-2b-it"  # Use GPT-2 instead of the gated model
+# tokenizer = AutoTokenizer.from_pretrained(conv_model_name, trust_remote_code=True, token = access_token)
+# model = AutoModelForCausalLM.from_pretrained(conv_model_name, trust_remote_code=True, token = access_token, torch_dtype=torch.bfloat16).to(device)
 # pipe1 = pipeline("text-generation", model="TinyLlama/TinyLlama-1.1B-Chat-v1.0").to(device)
 # model = "tiiuae/falcon-7b-instruct"
 # client = InferenceClient("google/gemma-2b-it")
 def conversation_predict(text):
+    interface = gr.interface.load("microsoft/Phi-3-mini-4k-instruct")
+    return interface.result
     # return client.text_generation(text, return_full_text=False)
     # pipe = pipeline(
     # "text-generation",
     # output = pipe(text, **generation_args)
     # return output[0]['generated_text']
+    # input_ids = tokenizer(text, return_tensors="pt")
+    # outputs = model.generate(**input_ids)
+    # return tokenizer.decode(outputs[0])
     # outputs = pipe1(text, max_new_tokens=256, temperature=0.7, top_k=50, top_p=0.95)
     # return outputs[0]["generated_text"]