Spaces:

adpro
/

querysurvey

Runtime error

adpro commited on Aug 23, 2024

Commit

7d4e9a8

verified ·

1 Parent(s): a823bf4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,20 +8,27 @@ from googlesearch import search
 from urllib.parse import parse_qs
 def run_lora(prompt,site,start,end):
     murl = "https://www.google.com/search?q=site:" +site + " " +prompt + "&sca_esv=9a56963d0daaccd0&sca_upv=1&tbs=cdr%3A1%2Ccd_min%3A"+start+"%2Ccd_max%3A" + end
     surl = "https://www.google.com/search?q=site:" +site + " " +prompt + "after:"+start+"before:" + end
     page = requests.get(murl)
     print("https://www.google.com/search?q=site:" +site + " " +prompt + "&tbs=cdr%3A1%2Ccd_min%3A"+start+"%2Ccd_max%3A" + end)
-    soup = BeautifulSoup(page.content)
     import re
-    links = soup.findAll("a")
-    mLink=""
-    #for link in soup.find_all("a", "html.parser", parse_only=SoupStrainer('a')):
-    for link in  soup.find_all("a",href=re.compile("(?<=/url\?q=)(htt.*://.*)")):
-        #print (re.split(":(?=http)",link["href"].replace("/url?q=","")))
-        j = re.split(":(?=http)",link["href"].replace("/url?q=",""))
-        mLink+= "\n" + str(j)
-    return mLink
 def extract_href(href):
     url = urlparse(href)

 from urllib.parse import parse_qs
 def run_lora(prompt,site,start,end):
     murl = "https://www.google.com/search?q=site:" +site + " " +prompt + "&sca_esv=9a56963d0daaccd0&sca_upv=1&tbs=cdr%3A1%2Ccd_min%3A"+start+"%2Ccd_max%3A" + end
     surl = "https://www.google.com/search?q=site:" +site + " " +prompt + "after:"+start+"before:" + end
     page = requests.get(murl)
     print("https://www.google.com/search?q=site:" +site + " " +prompt + "&tbs=cdr%3A1%2Ccd_min%3A"+start+"%2Ccd_max%3A" + end)
+    soup = BeautifulSoup(page.text,'html.parser')
     import re
+    search_results = []
+    for g in soup.find_all('div', class_='tF2Cxc'):
+        title = g.find('h3').text if g.find('h3') else 'No title'
+        link = g.find('a')['href']
+        snippet = g.find('div', class_='IsZvec').text if g.find('div', class_='IsZvec') else 'No snippet'
+        search_results.append({
+            'title': title,
+            'link': link,
+            'snippet': snippet
+        })
+    return search_results
 def extract_href(href):
     url = urlparse(href)