Spaces:
Runtime error
Runtime error
Update app.py
Browse files
app.py
CHANGED
@@ -8,34 +8,34 @@ from googlesearch import search
|
|
8 |
from urllib.parse import parse_qs
|
9 |
|
10 |
def run_lora(prompt,site,start,end):
|
11 |
-
|
12 |
-
|
13 |
-
|
14 |
-
|
15 |
-
|
16 |
-
# URL API của NewsAPI
|
17 |
-
url = (f'https://newsapi.org/v2/everything?'
|
18 |
-
f'q={prompt}&'
|
19 |
-
f'domains={site}&'
|
20 |
-
f'from={start}&to={end}&'
|
21 |
-
f'sortBy=relevancy&'
|
22 |
-
f'apiKey=8ac7c497c32a43f09fe9c39a7a316239')
|
23 |
-
|
24 |
-
# Gửi yêu cầu GET tới NewsAPI
|
25 |
-
response = requests.get(url)
|
26 |
data = response.json()
|
27 |
-
|
28 |
-
|
29 |
-
|
30 |
-
|
31 |
-
|
32 |
-
|
33 |
-
|
34 |
-
|
35 |
-
|
36 |
-
|
37 |
-
|
38 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
39 |
def extract_href(href):
|
40 |
url = urlparse(href)
|
41 |
query = parse_qs(url.query)
|
|
|
8 |
from urllib.parse import parse_qs
|
9 |
|
10 |
def run_lora(prompt,site,start,end):
|
11 |
+
url = (f"https://www.google.com/search?q=site:{site}+{urllib.parse.quote(query)}"
|
12 |
+
f"&tbs=cdr:1,cd_min:{start},cd_max:{end}")
|
13 |
+
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}
|
14 |
+
response = requests.get(url, headers=headers)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
15 |
data = response.json()
|
16 |
+
# Tìm tất cả các liên kết trong kết quả tìm kiếm
|
17 |
+
results = soup.find_all('a')
|
18 |
+
|
19 |
+
# Lọc và hiển thị các liên kết
|
20 |
+
for link in results:
|
21 |
+
href = link.get('href')
|
22 |
+
if href and href.startswith('/url?q='):
|
23 |
+
# Loại bỏ prefix '/url?q=' và tham số URL không cần thiết
|
24 |
+
full_url = href.split('/url?q=')[1].split('&')[0]
|
25 |
+
print(full_url)
|
26 |
+
|
27 |
+
# Lọc theo ngày tháng (nếu ngày tháng được cung cấp trong kết quả)
|
28 |
+
date_elements = soup.find_all('span', class_='f')
|
29 |
+
for date_elem in date_elements:
|
30 |
+
date_text = date_elem.text
|
31 |
+
try:
|
32 |
+
# Kiểm tra định dạng ngày tháng và so sánh
|
33 |
+
date = datetime.strptime(date_text, '%m-%d-%Y') # Ví dụ: '23 August 2024'
|
34 |
+
if start <= date.strftime('%m-%d-%Y') <= end:
|
35 |
+
print(f"Date: {date_text}")
|
36 |
+
except ValueError:
|
37 |
+
# Bỏ qua các định dạng ngày tháng không thể phân tích
|
38 |
+
pass
|
39 |
def extract_href(href):
|
40 |
url = urlparse(href)
|
41 |
query = parse_qs(url.query)
|