ap3

Sleeping

App Files Files Community

Reality123b commited on Aug 9

Commit

2145ed0

verified ·

1 Parent(s): 5879220

Update app.py

Browse files

Files changed (1) hide show

app.py +104 -27

app.py CHANGED Viewed

@@ -1,43 +1,120 @@
-from fastapi import FastAPI, HTTPException
 from pydantic import BaseModel
 from transformers import pipeline, TextStreamer
-import torch
 class ModelInput(BaseModel):
     prompt: str
-    max_new_tokens: int = 128000
 app = FastAPI()
-# Initialize text generation pipeline
 generator = pipeline(
     "text-generation",
     model="deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B",
-    device="cpu"  # Use CPU (change to device=0 for GPU)
 )
-# Create text streamer
-streamer = TextStreamer(generator.tokenizer, skip_prompt=True)
-def generate_response(prompt: str, max_new_tokens: int = 64000):
-    try:
-        messages = [{"role": "user", "content": prompt}]
-        output = generator(messages, max_new_tokens=max_new_tokens, do_sample=False, streamer=streamer)
-        return output[0]["generated_text"][-1]["content"]
-    except Exception as e:
-        raise ValueError(f"Error generating response: {e}")
-@app.post("/generate")
-async def generate_text(input: ModelInput):
-    try:
-        response = generate_response(
-            prompt=input.prompt,
-            max_new_tokens=input.max_new_tokens
-        )
-        return {"generated_text": response}
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
 @app.get("/")
 async def root():
-    return {"message": "Welcome to the Streaming Model API!"}

+from fastapi import FastAPI, Request, HTTPException
+from fastapi.responses import StreamingResponse
 from pydantic import BaseModel
 from transformers import pipeline, TextStreamer
+import asyncio
+import queue
+import threading
+import time
+import httpx
+import json
 class ModelInput(BaseModel):
     prompt: str
+    max_new_tokens: int = 128
 app = FastAPI()
+# Initialize generator once
 generator = pipeline(
     "text-generation",
     model="deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B",
+    device="cpu"
 )
+# Shared knowledge graph, just a dict (in-memory)
+knowledge_graph = {}
+# --- Autonomous knowledge updater --- #
+async def update_knowledge_graph_periodically():
+    while True:
+        try:
+            # Pick a random query (here: hardcoded or you can improve)
+            queries = ["latest tech startup news", "AI breakthroughs", "funding trends 2025"]
+            import random
+            query = random.choice(queries)
+            # Use DuckDuckGo Instant Answer API (free, no API key)
+            async with httpx.AsyncClient() as client:
+                resp = await client.get(
+                    "https://api.duckduckgo.com/",
+                    params={"q": query, "format": "json", "no_redirect": "1", "no_html": "1"}
+                )
+                data = resp.json()
+            # Extract some useful info (abstract text)
+            abstract = data.get("AbstractText", "")
+            related_topics = data.get("RelatedTopics", [])
+            # Save/update knowledge graph (super basic example)
+            knowledge_graph[query] = {
+                "abstract": abstract,
+                "related_topics": related_topics,
+                "timestamp": time.time()
+            }
+            print(f"Knowledge graph updated for query: {query}")
+        except Exception as e:
+            print(f"Error updating knowledge graph: {e}")
+        await asyncio.sleep(60)  # wait 1 minute before next update
+# Kick off background task on startup
+@app.on_event("startup")
+async def startup_event():
+    asyncio.create_task(update_knowledge_graph_periodically())
+# --- Streaming generation endpoint --- #
+@app.post("/generate/stream")
+async def generate_stream(input: ModelInput):
+    prompt = input.prompt
+    max_new_tokens = input.max_new_tokens
+    q = queue.Queue()
+    def run_generation():
+        try:
+            streamer = TextStreamer(generator.tokenizer, skip_prompt=True)
+            # Monkey-patch streamer to push tokens to queue
+            def queue_token(token):
+                q.put(token)
+            streamer.put = queue_token
+            # Run generation with streamer attached
+            generator(
+                prompt,
+                max_new_tokens=max_new_tokens,
+                do_sample=False,
+                streamer=streamer
+            )
+        except Exception as e:
+            q.put(f"[ERROR] {e}")
+        finally:
+            q.put(None)  # Sentinel to mark done
+    thread = threading.Thread(target=run_generation)
+    thread.start()
+    async def event_generator():
+        while True:
+            token = q.get()
+            if token is None:
+                break
+            yield token
+    return StreamingResponse(event_generator(), media_type="text/plain")
+# Optional: Endpoint to query knowledge graph
+@app.get("/knowledge")
+async def get_knowledge():
+    return knowledge_graph
+# Root
 @app.get("/")
 async def root():
+    return {"message": "Welcome to the Streaming Model API with live knowledge graph updater!"}