Spaces:

WolfeLeo2
/

Studai

Sleeping

App Files Files Community

WolfeLeo2 commited on May 8

Commit

30e18b9

1 Parent(s): ed4fa64

fixed app=app

Browse files

Files changed (1) hide show

app.py +64 -61

app.py CHANGED Viewed

@@ -1,82 +1,85 @@
-import gradio as gr
 import logging
-from fastapi import FastAPI
-from pydantic import BaseModel
-from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 import torch
-from fastapi.middleware.cors import CORSMiddleware
 # Configure logging
-logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(name)s - %(levelname)s - %(message)s')
 logger = logging.getLogger(__name__)
-# Load FLAN-T5 model
 model_name = "google/flan-t5-base"
-logger.info(f"Loading {model_name} model...")
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
-logger.info("Model loaded successfully!")
-# -----------------------------
-# REST API SECTION
-# -----------------------------
-api = FastAPI()
-api.add_middleware(
-    CORSMiddleware,
-    allow_origins=["*"],  # Change to your domain later
-    allow_credentials=True,
-    allow_methods=["*"],
-    allow_headers=["*"],
-)
-class SummarizeRequest(BaseModel):
     text: str
-    max_length: int = 150
-    min_length: int = 30
-@api.post("/summarize")
-def summarize_endpoint(request: SummarizeRequest):
-    text = request.text.strip()
-    if not text or len(text) < 50:
-        return {"summary": text}
-    logger.info(f"Summarizing via API. Length: {len(text)}")
-    input_text = f"summarize: {text}"
-    inputs = tokenizer(input_text, return_tensors="pt", truncation=True, max_length=1024)
-    # Safe dynamic length handling
-    max_tokens = min(request.max_length, 512)
-    min_tokens = min(request.min_length, max_tokens - 1)
     outputs = model.generate(
-        **inputs,
-        max_new_tokens=max_tokens,
-        min_length=min_tokens
     )
     summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
-    return {"summary": summary}
-# -----------------------------
-# GRADIO UI SECTION
-# -----------------------------
-def summarize_text(text, max_length=150, min_length=30):
-    return summarize_endpoint(SummarizeRequest(text=text, max_length=max_length, min_length=min_length))["summary"]
 demo = gr.Interface(
-    fn=summarize_text,
     inputs=[
-        gr.Textbox(lines=10, label="Text to Summarize"),
-        gr.Slider(50, 512, value=150, label="Max Length"),
-        gr.Slider(10, 300, value=30, label="Min Length")
     ],
-    outputs=gr.Textbox(label="Summary"),
-    title="StudAI Text Summarization",
-    description="Powered by google/flan-t5-base model"
 )
-# Mount Gradio + API
-app = FastAPI()
-app.mount("/", api)
-demo.launch(server_name="0.0.0.0", server_port=7860, root_path="/", app=app)

+import os
 import logging
 import torch
+from transformers import T5Tokenizer, T5ForConditionalGeneration
+from fastapi import FastAPI, HTTPException
+from pydantic import BaseModel
+import gradio as gr
+from typing import Optional
 # Configure logging
+logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
+# Load model and tokenizer
 model_name = "google/flan-t5-base"
+logger.info(f"Loading {model_name}...")
+tokenizer = T5Tokenizer.from_pretrained(model_name)
+model = T5ForConditionalGeneration.from_pretrained(model_name)
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+model.to(device)
+logger.info(f"Model loaded, using device: {device}")
+# FastAPI app
+app = FastAPI()
+# Pydantic model for request validation
+class SummarizationRequest(BaseModel):
     text: str
+    max_length: Optional[int] = 150
+    min_length: Optional[int] = 30
+# Summarization function
+def summarize_text(text, max_length=150, min_length=30):
+    logger.info(f"Summarizing text of length {len(text)}")
+    inputs = tokenizer("summarize: " + text, return_tensors="pt", truncation=True, max_length=512).to(device)
     outputs = model.generate(
+        inputs.input_ids,
+        max_length=max_length,
+        min_length=min_length,
+        length_penalty=2.0,
+        num_beams=4,
+        early_stopping=True
     )
     summary = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    logger.info(f"Generated summary of length {len(summary)}")
+    return summary
+# REST API endpoint
+@app.post("/summarize")
+async def summarize(request: SummarizationRequest):
+    try:
+        summary = summarize_text(
+            request.text,
+            max_length=request.max_length,
+            min_length=request.min_length
+        )
+        return {"summary": summary}
+    except Exception as e:
+        logger.error(f"Error in summarization: {str(e)}")
+        raise HTTPException(status_code=500, detail=str(e))
+# Gradio interface
+def gradio_summarize(text, max_length=150, min_length=30):
+    return summarize_text(text, max_length, min_length)
 demo = gr.Interface(
+    fn=gradio_summarize,
     inputs=[
+        gr.Textbox(lines=10, placeholder="Enter text to summarize..."),
+        gr.Slider(minimum=50, maximum=200, value=150, step=10, label="Maximum Length"),
+        gr.Slider(minimum=10, maximum=100, value=30, step=5, label="Minimum Length")
     ],
+    outputs="text",
+    title="Text Summarization with FLAN-T5",
+    description="This app summarizes text using Google's FLAN-T5 model."
 )
+# Mount the Gradio app at the root path
+app = gr.mount_gradio_app(app, demo, path="/")
+# Start the server
+if __name__ == "__main__":
+    import uvicorn
+    # Start server with both FastAPI and Gradio
+    uvicorn.run(app, host="0.0.0.0", port=7860)