Spaces:

luck210
/

gemma

Sleeping

luck210 commited on Mar 25

Commit

980bd4e

verified ·

1 Parent(s): a9dd3d9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,15 +4,15 @@ import os
 app = FastAPI()
-# Récupérer le token Hugging Face depuis la variable d’environnement
 hf_token = os.getenv("yoyo")
 if not hf_token:
-    raise ValueError("HF_TOKEN n’est pas défini. Ajoute-le dans les secrets de Hugging Face Spaces.")
 # Charger Llama 2 avec le token
 model_name = "meta-llama/Llama-2-7b-chat-hf"
-tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=hf_token)
-model = AutoModelForCausalLM.from_pretrained(model_name, use_auth_token=hf_token)
 @app.get("/")
 async def root():
@@ -23,8 +23,8 @@ async def root():
 async def summarize_text(file: UploadFile = File(...)):
     content = await file.read()
     text = content.decode("utf-8")
-    prompt = f"Summarize this text in 3 short sentences: {text}"
     inputs = tokenizer(prompt, return_tensors="pt")
-    outputs = model.generate(**inputs, max_length=100, num_return_sequences=1)
     summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return {"summary": summary}

 app = FastAPI()
+# Récupérer le token Hugging Face depuis les secrets
 hf_token = os.getenv("yoyo")
 if not hf_token:
+    raise ValueError("HF_TOKEN n’est pas défini dans les secrets de Hugging Face Spaces.")
 # Charger Llama 2 avec le token
 model_name = "meta-llama/Llama-2-7b-chat-hf"
+tokenizer = AutoTokenizer.from_pretrained(model_name, token=hf_token)
+model = AutoModelForCausalLM.from_pretrained(model_name, token=hf_token)
 @app.get("/")
 async def root():
 async def summarize_text(file: UploadFile = File(...)):
     content = await file.read()
     text = content.decode("utf-8")
+    prompt = f"[INST] Summarize this text in 3 short sentences: {text} [/INST]"
     inputs = tokenizer(prompt, return_tensors="pt")
+    outputs = model.generate(**inputs, max_length=150, num_return_sequences=1)
     summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
     return {"summary": summary}