Spaces:

adpro
/

querysurvey

Runtime error

App Files Files Community

adpro commited on Aug 23, 2024

Commit

c5911fa

verified ·

1 Parent(s): cfda50b

Update app.py

Browse files

Files changed (1) hide show

app.py +27 -27

app.py CHANGED Viewed

@@ -8,34 +8,34 @@ from googlesearch import search
 from urllib.parse import parse_qs
 def run_lora(prompt,site,start,end):
-    #url = f"https://www.googleapis.com/customsearch/v1?q=site:{site}+{prompt}&cx={SEARCH_ENGINE_ID}&key=AIzaSyCnsm9J-9zkLTKLHrt7UiMXNuOU5ddas08&sort=date:r:{start}:{end}"
-    # API key từ NewsAPI
-    api_key = f'8ac7c497c32a43f09fe9c39a7a316239'
-# URL API của NewsAPI
-    url = (f'https://newsapi.org/v2/everything?'
-       f'q={prompt}&'
-       f'domains={site}&'
-       f'from={start}&to={end}&'
-       f'sortBy=relevancy&'
-       f'apiKey=8ac7c497c32a43f09fe9c39a7a316239')
-# Gửi yêu cầu GET tới NewsAPI
-    response = requests.get(url)
     data = response.json()
-    links=""
-    if data["status"] == "ok":
-        for article in data["articles"]:  # Lấy 5 bài báo đầu tiên
-            print(f"Title: {article['title']}")
-            print(f"Link: {article['url']}")
-            print(f"Published At: {article['publishedAt']}")
-            print('-' * 80)
-            links+="/n"+{article['url']}
-    else:
-        print("Error fetching data.")
-    return links
 def extract_href(href):
     url = urlparse(href)
     query = parse_qs(url.query)

 from urllib.parse import parse_qs
 def run_lora(prompt,site,start,end):
+    url = (f"https://www.google.com/search?q=site:{site}+{urllib.parse.quote(query)}"
+       f"&tbs=cdr:1,cd_min:{start},cd_max:{end}")
+    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}
+    response = requests.get(url, headers=headers)
     data = response.json()
+    # Tìm tất cả các liên kết trong kết quả tìm kiếm
+    results = soup.find_all('a')
+    # Lọc và hiển thị các liên kết
+    for link in results:
+        href = link.get('href')
+        if href and href.startswith('/url?q='):
+            # Loại bỏ prefix '/url?q=' và tham số URL không cần thiết
+            full_url = href.split('/url?q=')[1].split('&')[0]
+            print(full_url)
+    # Lọc theo ngày tháng (nếu ngày tháng được cung cấp trong kết quả)
+    date_elements = soup.find_all('span', class_='f')
+    for date_elem in date_elements:
+        date_text = date_elem.text
+        try:
+            # Kiểm tra định dạng ngày tháng và so sánh
+            date = datetime.strptime(date_text, '%m-%d-%Y')  # Ví dụ: '23 August 2024'
+            if start <= date.strftime('%m-%d-%Y') <= end:
+                print(f"Date: {date_text}")
+        except ValueError:
+            # Bỏ qua các định dạng ngày tháng không thể phân tích
+            pass
 def extract_href(href):
     url = urlparse(href)
     query = parse_qs(url.query)