Spaces:

luck210
/

gemma

Sleeping

gemma / app.py

Update app.py

fc96b33 verified 5 months ago

1.19 kB

	from fastapi import FastAPI, UploadFile, File
	from transformers import AutoModelForCausalLM, AutoTokenizer
	import os

	app = FastAPI()

	# Récupérer le token Hugging Face depuis la variable d’environnement
	hf_token = os.getenv("yoyo")
	if not hf_token:
	raise ValueError("HF_TOKEN n’est pas défini. Ajoute-le dans les secrets de Hugging Face Spaces.")

	# Charger Llama 2 avec le token
	model_name = "meta-llama/Llama-2-7b-chat-hf"
	tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=hf_token)
	model = AutoModelForCausalLM.from_pretrained(model_name, use_auth_token=hf_token)

	@app.get("/")
	async def root():
	return {"message": "API avec Llama 2 sur Hugging Face Spaces"}

	# Endpoint pour résumer un texte
	@app.post("/summarization/text")
	async def summarize_text(file: UploadFile = File(...)):
	content = await file.read()
	text = content.decode("utf-8")
	prompt = f"Summarize this text in 3 short sentences: {text}"
	inputs = tokenizer(prompt, return_tensors="pt")
	outputs = model.generate(**inputs, max_length=100, num_return_sequences=1)
	summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
	return {"summary": summary}