adpro commited on
Commit
c5911fa
·
verified ·
1 Parent(s): cfda50b

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +27 -27
app.py CHANGED
@@ -8,34 +8,34 @@ from googlesearch import search
8
  from urllib.parse import parse_qs
9
 
10
  def run_lora(prompt,site,start,end):
11
- #url = f"https://www.googleapis.com/customsearch/v1?q=site:{site}+{prompt}&cx={SEARCH_ENGINE_ID}&key=AIzaSyCnsm9J-9zkLTKLHrt7UiMXNuOU5ddas08&sort=date:r:{start}:{end}"
12
-
13
- # API key từ NewsAPI
14
- api_key = f'8ac7c497c32a43f09fe9c39a7a316239'
15
-
16
- # URL API của NewsAPI
17
- url = (f'https://newsapi.org/v2/everything?'
18
- f'q={prompt}&'
19
- f'domains={site}&'
20
- f'from={start}&to={end}&'
21
- f'sortBy=relevancy&'
22
- f'apiKey=8ac7c497c32a43f09fe9c39a7a316239')
23
-
24
- # Gửi yêu cầu GET tới NewsAPI
25
- response = requests.get(url)
26
  data = response.json()
27
- links=""
28
- if data["status"] == "ok":
29
- for article in data["articles"]: # Lấy 5 bài báo đầu tiên
30
- print(f"Title: {article['title']}")
31
- print(f"Link: {article['url']}")
32
- print(f"Published At: {article['publishedAt']}")
33
- print('-' * 80)
34
- links+="/n"+{article['url']}
35
- else:
36
- print("Error fetching data.")
37
- return links
38
-
 
 
 
 
 
 
 
 
 
 
 
39
  def extract_href(href):
40
  url = urlparse(href)
41
  query = parse_qs(url.query)
 
8
  from urllib.parse import parse_qs
9
 
10
  def run_lora(prompt,site,start,end):
11
+ url = (f"https://www.google.com/search?q=site:{site}+{urllib.parse.quote(query)}"
12
+ f"&tbs=cdr:1,cd_min:{start},cd_max:{end}")
13
+ headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}
14
+ response = requests.get(url, headers=headers)
 
 
 
 
 
 
 
 
 
 
 
15
  data = response.json()
16
+ # Tìm tất cả các liên kết trong kết quả tìm kiếm
17
+ results = soup.find_all('a')
18
+
19
+ # Lọc và hiển thị các liên kết
20
+ for link in results:
21
+ href = link.get('href')
22
+ if href and href.startswith('/url?q='):
23
+ # Loại bỏ prefix '/url?q=' và tham số URL không cần thiết
24
+ full_url = href.split('/url?q=')[1].split('&')[0]
25
+ print(full_url)
26
+
27
+ # Lọc theo ngày tháng (nếu ngày tháng được cung cấp trong kết quả)
28
+ date_elements = soup.find_all('span', class_='f')
29
+ for date_elem in date_elements:
30
+ date_text = date_elem.text
31
+ try:
32
+ # Kiểm tra định dạng ngày tháng và so sánh
33
+ date = datetime.strptime(date_text, '%m-%d-%Y') # Ví dụ: '23 August 2024'
34
+ if start <= date.strftime('%m-%d-%Y') <= end:
35
+ print(f"Date: {date_text}")
36
+ except ValueError:
37
+ # Bỏ qua các định dạng ngày tháng không thể phân tích
38
+ pass
39
  def extract_href(href):
40
  url = urlparse(href)
41
  query = parse_qs(url.query)