Spaces:

rein0421
/

AIdentify

Running

AIdentify / test.py

syurein

search機能の実装

68c46ce about 1 month ago

1.07 kB

	from LLM_package import ObjectDetector
	import os
	from dotenv import load_dotenv
	import numpy as np
	import cv2
	import asyncio

	from PIL import Image
	from search import WebScraper
	load_dotenv(dotenv_path='../.env')
	async def main():
	scraper = WebScraper(headless=False) # UIなしで実行

	# 個人情報流出に関する事例を検索し、上位2件のクリーンなコンテンツを取得
	personal_breach_docs = await scraper.get_processed_documents(
	search_query="個人情報流出事例",
	num_search_results=2
	)

	if personal_breach_docs:
	print("\n--- 全ての処理済みドキュメントの概要 ---")
	for doc in personal_breach_docs:
	print(f"タイトル: {doc['title']}")
	print(f"URL: {doc['original_url']}")
	print(f"コンテンツサイズ: {len(doc['cleaned_html_content'])} 文字")
	print("-" * 30)
	else:
	print("処理されたドキュメントはありませんでした。")
	if __name__ == "__main__":
	asyncio.run(main())