""" RPAシステム with Gradio ======================== Playwright + Gradio を使った Web RPA システム 機能: - 🎯 ウェブページスクリーンショット - 🖱️ 画面操作自動化 - 📸 画像比較・認識 - 🔄 定期実行・監視 - 📊 実行履歴・ログ管理 """ import asyncio import os import sys import datetime import json import sqlite3 from typing import Optional, List, Dict, Tuple from pathlib import Path import traceback import gradio as gr from PIL import Image, ImageDraw, ImageChops import io import base64 # Playwrightのインポート(遅延インポート) try: from playwright.async_api import async_playwright, Browser, Page PLAYWRIGHT_AVAILABLE = True except ImportError: PLAYWRIGHT_AVAILABLE = False print("⚠️ Playwright not installed. Install with: pip install playwright && playwright install") # インターフェースメタデータ interface_title = "🤖 RPA自動化システム" interface_description = "Playwright + Gradio による Web RPA・画面自動化" class RPAManager: def __init__(self, db_path: str = "rpa_history.db"): """RPA管理システムの初期化""" self.db_path = db_path self.init_database() self.browser = None self.page = None def init_database(self): """データベース初期化""" conn = sqlite3.connect(self.db_path) cursor = conn.cursor() # RPA実行履歴テーブル cursor.execute(''' CREATE TABLE IF NOT EXISTS rpa_executions ( id INTEGER PRIMARY KEY AUTOINCREMENT, task_name TEXT NOT NULL, url TEXT, action_type TEXT NOT NULL, parameters TEXT, screenshot_path TEXT, success BOOLEAN, error_message TEXT, execution_time REAL, created_at DATETIME DEFAULT CURRENT_TIMESTAMP ) ''') # RPAタスクテンプレートテーブル cursor.execute(''' CREATE TABLE IF NOT EXISTS rpa_templates ( id INTEGER PRIMARY KEY AUTOINCREMENT, template_name TEXT NOT NULL UNIQUE, description TEXT, actions TEXT NOT NULL, created_at DATETIME DEFAULT CURRENT_TIMESTAMP, updated_at DATETIME DEFAULT CURRENT_TIMESTAMP ) ''') conn.commit() conn.close() print("✅ RPA データベース初期化完了") async def capture_screenshot(self, url: str, selector: str = None, wait_time: int = 3) -> Tuple[Image.Image, str]: """ ウェブページのスクリーンショットを取得 Args: url: 対象URL selector: 特定要素のセレクタ(オプション) wait_time: 待機時間(秒) Returns: (画像, エラーメッセージ) """ if not PLAYWRIGHT_AVAILABLE: return None, "Playwright がインストールされていません" try: async with async_playwright() as p: browser = await p.chromium.launch(headless=True) page = await browser.new_page() # ページ読み込み await page.goto(url, wait_until='networkidle') # 待機 await asyncio.sleep(wait_time) # スクリーンショット取得 if selector: # 特定要素のスクリーンショット element = await page.query_selector(selector) if element: screenshot_bytes = await element.screenshot() else: screenshot_bytes = await page.screenshot() return None, f"セレクタ '{selector}' が見つかりません" else: # ページ全体のスクリーンショット screenshot_bytes = await page.screenshot(full_page=True) await browser.close() # PIL画像に変換 img = Image.open(io.BytesIO(screenshot_bytes)) # 実行履歴を保存 self.save_execution( task_name="スクリーンショット取得", url=url, action_type="screenshot", parameters=json.dumps({"selector": selector, "wait_time": wait_time}), success=True ) return img, "✅ スクリーンショット取得成功" except Exception as e: error_msg = f"❌ エラー: {str(e)}" # エラーログを保存 self.save_execution( task_name="スクリーンショット取得", url=url, action_type="screenshot", parameters=json.dumps({"selector": selector, "wait_time": wait_time}), success=False, error_message=str(e) ) return None, error_msg async def click_element(self, url: str, selector: str, wait_time: int = 3) -> Tuple[Image.Image, str]: """ 要素をクリックして結果をキャプチャ Args: url: 対象URL selector: クリック対象のセレクタ wait_time: クリック後の待機時間 Returns: (クリック後の画像, メッセージ) """ if not PLAYWRIGHT_AVAILABLE: return None, "Playwright がインストールされていません" try: async with async_playwright() as p: browser = await p.chromium.launch(headless=True) page = await browser.new_page() # ページ読み込み await page.goto(url, wait_until='networkidle') # 要素を待機してクリック await page.wait_for_selector(selector, timeout=10000) await page.click(selector) # 待機 await asyncio.sleep(wait_time) # クリック後のスクリーンショット screenshot_bytes = await page.screenshot(full_page=True) await browser.close() img = Image.open(io.BytesIO(screenshot_bytes)) # 実行履歴を保存 self.save_execution( task_name="要素クリック", url=url, action_type="click", parameters=json.dumps({"selector": selector, "wait_time": wait_time}), success=True ) return img, f"✅ 要素クリック成功: {selector}" except Exception as e: error_msg = f"❌ クリックエラー: {str(e)}" self.save_execution( task_name="要素クリック", url=url, action_type="click", parameters=json.dumps({"selector": selector, "wait_time": wait_time}), success=False, error_message=str(e) ) return None, error_msg async def fill_form(self, url: str, form_data: Dict[str, str], submit_selector: str = None) -> Tuple[Image.Image, str]: """ フォーム入力と送信 Args: url: 対象URL form_data: {セレクタ: 入力値} の辞書 submit_selector: 送信ボタンのセレクタ Returns: (実行後の画像, メッセージ) """ if not PLAYWRIGHT_AVAILABLE: return None, "Playwright がインストールされていません" try: async with async_playwright() as p: browser = await p.chromium.launch(headless=True) page = await browser.new_page() await page.goto(url, wait_until='networkidle') # フォーム入力 for selector, value in form_data.items(): await page.wait_for_selector(selector, timeout=10000) await page.fill(selector, value) await asyncio.sleep(0.5) # 送信ボタンクリック if submit_selector: await page.click(submit_selector) await asyncio.sleep(3) # 結果のスクリーンショット screenshot_bytes = await page.screenshot(full_page=True) await browser.close() img = Image.open(io.BytesIO(screenshot_bytes)) self.save_execution( task_name="フォーム入力", url=url, action_type="fill_form", parameters=json.dumps({"form_data": form_data, "submit_selector": submit_selector}), success=True ) return img, "✅ フォーム入力・送信成功" except Exception as e: error_msg = f"❌ フォーム入力エラー: {str(e)}" self.save_execution( task_name="フォーム入力", url=url, action_type="fill_form", parameters=json.dumps({"form_data": form_data, "submit_selector": submit_selector}), success=False, error_message=str(e) ) return None, error_msg async def collect_images_from_page(self, url: str, image_selector: str = "img", download_path: str = None, limit: int = 10) -> Tuple[List[str], str]: """ ウェブページから画像を取得・ダウンロード Args: url: 対象URL image_selector: 画像要素のセレクタ(デフォルト: "img") download_path: ダウンロード先パス limit: 取得画像数の上限 Returns: (ダウンロードファイルパスのリスト, メッセージ) """ if not PLAYWRIGHT_AVAILABLE: return [], "Playwright がインストールされていません" if not download_path: download_path = "/workspaces/fastapi_django_main_live/docs/images/collected" import os import requests from urllib.parse import urljoin, urlparse from pathlib import Path # ダウンロードディレクトリ作成 Path(download_path).mkdir(parents=True, exist_ok=True) try: async with async_playwright() as p: browser = await p.chromium.launch(headless=True) context = await browser.new_context() page = await context.new_page() await page.goto(url, wait_until="networkidle") await asyncio.sleep(2) # 画像要素を取得 image_elements = await page.query_selector_all(image_selector) print(f"🖼️ {len(image_elements)}個の画像要素を発見") downloaded_files = [] for i, img_element in enumerate(image_elements[:limit]): try: # 画像のsrc属性を取得 src = await img_element.get_attribute('src') if not src: continue # 相対パスを絶対パスに変換 image_url = urljoin(url, src) # ファイル名を生成 parsed_url = urlparse(image_url) filename = os.path.basename(parsed_url.path) if not filename or '.' not in filename: filename = f"image_{i+1}.jpg" # ファイルパス file_path = os.path.join(download_path, filename) # 画像をダウンロード response = requests.get(image_url, stream=True, timeout=10) if response.status_code == 200: with open(file_path, 'wb') as f: for chunk in response.iter_content(chunk_size=8192): f.write(chunk) downloaded_files.append(file_path) print(f"✅ ダウンロード完了: {filename}") else: print(f"⚠️ ダウンロード失敗: {image_url} (Status: {response.status_code})") except Exception as e: print(f"⚠️ 画像処理エラー: {e}") continue await browser.close() # 実行履歴保存 self.save_execution( task_name="画像取得", url=url, action_type="collect_images", parameters=json.dumps({ "image_selector": image_selector, "download_path": download_path, "limit": limit, "downloaded_count": len(downloaded_files) }), success=True ) return downloaded_files, f"✅ {len(downloaded_files)}個の画像を取得しました" except Exception as e: error_msg = f"❌ 画像取得エラー: {str(e)}" self.save_execution( task_name="画像取得", url=url, action_type="collect_images", parameters=json.dumps({ "image_selector": image_selector, "download_path": download_path, "limit": limit }), success=False, error_message=str(e) ) return [], error_msg async def create_image_gallery(self, image_paths: List[str], output_path: str = None) -> str: """ 取得した画像から一覧ギャラリーを作成 Args: image_paths: 画像ファイルパスのリスト output_path: 出力HTMLファイルパス Returns: 生成されたHTMLファイルパス """ if not output_path: output_path = "/workspaces/fastapi_django_main_live/docs/image_gallery.html" # HTMLギャラリー生成 html_content = """
🎯 取得画像数: {image_count}
📅 生成日時: {timestamp}