Spaces:

OrganizedProgrammers
/

arXiv

Sleeping

App Files Files Community

Omar ID EL MOUMEN commited on Mar 31

Commit

26ddf5d

1 Parent(s): ad66b01

Change response

Browse files

Files changed (2) hide show

app.py +8 -21
static/script.js +2 -2

app.py CHANGED Viewed

@@ -105,17 +105,7 @@ async def extract_arxiv_pdf(document: DocumentID):
         postprocess_text = remove_punctuations(postprocess_text)
         postprocess_text = re.sub(r"\s+", " ", postprocess_text)
         postprocess_text = postprocess_text.strip()
-        regex_titles = r"(?:[IVX]+|[0-9]+)\.\s[A-Z0-9\s]+$"
-        titles = doc.get_toc()
-        main_titles = []
-        if len(titles) <= 0:
-            main_titles = re.findall(regex_titles, postprocess_text, flags=re.MULTILINE)
-            main_titles = [(-1, t) for t in main_titles]
-        else:
-            for title in titles:
-                if title[0] == 1 or title[0] == 2:
-                    main_titles.append((title[0], title[1]))
-        return {"pub_id": document.doc_id, "text": postprocess_text, "error": False} if len(main_titles) > 0 else {"pub_id": document.doc_id, "titles": "No titles found !", "text": postprocess_text, "error": False}
     else:
         print("ID: " + document.doc_id)
         print("URL: " + f"http://arxiv.org/pdf/{document.doc_id}")
@@ -136,7 +126,7 @@ async def extract_pdf(pdf: WebPDF):
         postprocess_text = remove_punctuations(postprocess_text)
         postprocess_text = re.sub(r"\s+", " ", postprocess_text)
         postprocess_text = postprocess_text.strip()
-        return {"error": False, "title": pdf_metadata.get("title", "").strip(), "text": postprocess_text}
     else:
         print("URL: " + pdf.url)
         print("Status code: " + str(pdf_req.status_code))
@@ -350,18 +340,15 @@ research how new business models beyond ROI could benefit societal impact of 6G
   response = requests.post(url, headers=headers, data=json.dumps(data), verify=False)
   if response.status_code != 200:
     print(f"Groq API error on post: {response.status_code}")
-    return ""
   try:
     response_data = response.json()
     raw_content = response_data['choices'][0]['message']['content'].strip()
-    print(response_data)
-    print("Tokens utilisé (prompt): ", response_data['usage']['prompt_tokens'])
-    print("Tokens utilisé (total): ", response_data['usage']['total_tokens'])
     return raw_content
   except Exception as e:
     print(f"Groq API error after post: {str(e)}")
-    return ""
 class GroqRequest(BaseModel):
     model: str
@@ -370,12 +357,12 @@ class GroqRequest(BaseModel):
 @app.post("/search/plan")
 async def get_research_plan(infos: GroqRequest, api_key: str = Header(None, alias="GROQ_TOKEN")):
     if api_key is None:
-        return {"error": True, "message": "Missing API key", "plan": ""}
     plan = researcher(infos.model, infos.user, api_key)
-    if plan == "":
-        return {"error": True, "plan": "", "message": "Error while generating the research plan"}
     plan = json.loads(re.sub(r"\s+", " ", plan))
-    return {"error": False, "plan": plan}
 @app.post("/search/plan/arxiv")
 async def get_arxiv_research_plan(infos: GroqRequest, api_key: str = Header(None, alias="GROQ_TOKEN")):

         postprocess_text = remove_punctuations(postprocess_text)
         postprocess_text = re.sub(r"\s+", " ", postprocess_text)
         postprocess_text = postprocess_text.strip()
+        return {"error": False, "message": {"pub_id": document.doc_id, "text": postprocess_text}}
     else:
         print("ID: " + document.doc_id)
         print("URL: " + f"http://arxiv.org/pdf/{document.doc_id}")
         postprocess_text = remove_punctuations(postprocess_text)
         postprocess_text = re.sub(r"\s+", " ", postprocess_text)
         postprocess_text = postprocess_text.strip()
+        return {"error": False, "message": {"title": pdf_metadata.get("title", "No title found").strip(), "text": postprocess_text}}
     else:
         print("URL: " + pdf.url)
         print("Status code: " + str(pdf_req.status_code))
   response = requests.post(url, headers=headers, data=json.dumps(data), verify=False)
   if response.status_code != 200:
     print(f"Groq API error on post: {response.status_code}")
+    return None
   try:
     response_data = response.json()
     raw_content = response_data['choices'][0]['message']['content'].strip()
     return raw_content
   except Exception as e:
     print(f"Groq API error after post: {str(e)}")
+    return None
 class GroqRequest(BaseModel):
     model: str
 @app.post("/search/plan")
 async def get_research_plan(infos: GroqRequest, api_key: str = Header(None, alias="GROQ_TOKEN")):
     if api_key is None:
+        return {"error": True, "message": "Missing API key"}
     plan = researcher(infos.model, infos.user, api_key)
+    if plan is None:
+        return {"error": True, "message": "Error while generating the research plan"}
     plan = json.loads(re.sub(r"\s+", " ", plan))
+    return {"error": False, "message": {"plan": plan}}
 @app.post("/search/plan/arxiv")
 async def get_arxiv_research_plan(infos: GroqRequest, api_key: str = Header(None, alias="GROQ_TOKEN")):

static/script.js CHANGED Viewed

@@ -50,7 +50,7 @@ document.addEventListener('DOMContentLoaded', function() {
                 return;
             }
-            displayPlan(data.plan);
         } catch (error) {
             console.error('Search error:', error);
             resultsContainer.innerHTML = `<div class="error-message">Error performing generation: ${error.message}</div>`;
@@ -198,7 +198,7 @@ document.addEventListener('DOMContentLoaded', function() {
                     }
                     text = "";
-                    popupText.textContent = data.text;
                 } catch (error) {
                     console.error('Search error:', error);
                     popupText.innerHTML = `<div class="error-message">Error performing search: ${error.message}</div>`;

                 return;
             }
+            displayPlan(data.message.plan);
         } catch (error) {
             console.error('Search error:', error);
             resultsContainer.innerHTML = `<div class="error-message">Error performing generation: ${error.message}</div>`;
                     }
                     text = "";
+                    popupText.textContent = data.message.text;
                 } catch (error) {
                     console.error('Search error:', error);
                     popupText.innerHTML = `<div class="error-message">Error performing search: ${error.message}</div>`;