Spaces:

adpro
/

querysurvey

Runtime error

adpro commited on Aug 22, 2024

Commit

74ee06b

verified ·

1 Parent(s): 8691072

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,9 +1,8 @@
 import requests
-import bs4
-import gradio as gr
 from bs4 import BeautifulSoup
-from googlesearch import search
-import urllib.request
 def run_lora(prompt,site,start,end):
@@ -11,20 +10,42 @@ def run_lora(prompt,site,start,end):
 # to search
-    page = requests.get("https://www.google.com/search?q=inurl:" +site + "+" +prompt + "&tbs=cdr%3A1%2Ccd_min%3A"+start+"%2Ccd_max%3A" + end)
-    print("https://www.google.com/search?q=inurl:" +site + " " +prompt + "&tbs=cdr%3A1%2Ccd_min%3A"+start+"%2Ccd_max%3A" + end)
-    soup = BeautifulSoup(page.content)
-    features="html.parser"
-    import re
     links = soup.findAll("a")
     mLink=""
-    #for link in soup.find_all("a", "html.parser", parse_only=SoupStrainer('a')):
-    for link in  soup.find_all("a",href=re.compile("(?<=/url\?q=)(htt.*://.*)")):
-        print (re.split(":(?=http)",link["href"].replace("/url?q=","").replace("'","")))
-        mLink+=str(re.split(":(?=http)",link["href"].replace("/url?q=","").replace("'","")))
-    return mLink
 with gr.Blocks() as app:
     gr.HTML("""<html>
   <head>

 import requests
 from bs4 import BeautifulSoup
+from rich import print
+from urllib.parse import urlparse
+from urllib.parse import parse_qs
 def run_lora(prompt,site,start,end):
 # to search
+    query = "Python programming"
+    url = fhttps://www.google.com/search?q=inurl:" +site + "+" +prompt + "&tbs=cdr%3A1%2Ccd_min%3A"+start+"%2Ccd_max%3A" + end
+    response = requests.get(url)
+    soup = BeautifulSoup(response.text, 'html.parser')
+    print(soup)
     links = soup.findAll("a")
     mLink=""
+    extract_results(soup)
+def extract_results(soup):
+    main = soup.select_one("#main")
+    res = []
+    for gdiv in main.select('.g, .fP1Qef'):
+        res.append(extract_section(gdiv))
+    return res
+def extract_section(gdiv):
+    # Getting our elements
+    title = gdiv.select_one('h3')
+    link = gdiv.select_one('a')
+    description = gdiv.find('.BNeawe')
+    return {
+        # Extract title's text only if text is found
+        'title': title.text if title else None,
+        'link': extract_href(link['href']) if link else None,
+        'description': description.text if description else None
+    }
+def extract_href(href):
+    url = urlparse(href)
+    query = parse_qs(url.query)
+    if not ('q' in query and query['q'] and len(query['q']) > 0):
+        return None
+    return query['q'][0]
 with gr.Blocks() as app:
     gr.HTML("""<html>
   <head>