neural-os

Runtime error

App Files Files Community

da03 commited on Jul 13

Commit

8b76adf

1 Parent(s): 4036b4b

.

Browse files

Files changed (5) hide show

dispatcher.py +282 -4
main.py +10 -2
start_system.sh +3 -0
static/index.html +30 -3
worker.py +103 -8

dispatcher.py CHANGED Viewed

@@ -11,11 +11,157 @@ from enum import Enum
 import uuid
 import aiohttp
 import logging
 # Configure logging
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 class SessionStatus(Enum):
     QUEUED = "queued"
     ACTIVE = "active"
@@ -33,6 +179,9 @@ class UserSession:
     last_activity: Optional[float] = None
     max_session_time: Optional[float] = None
     user_has_interacted: bool = False
 @dataclass
 class WorkerInfo:
@@ -67,6 +216,15 @@ class SessionManager:
             last_ping=time.time()
         )
         logger.info(f"Registered worker {worker_id} on GPU {gpu_id} at {endpoint}")
     async def get_available_worker(self) -> Optional[WorkerInfo]:
         """Get an available worker"""
@@ -80,6 +238,7 @@ class SessionManager:
         self.sessions[session.session_id] = session
         self.session_queue.append(session.session_id)
         session.status = SessionStatus.QUEUED
         logger.info(f"Added session {session.session_id} to queue. Queue size: {len(self.session_queue)}")
     async def process_queue(self):
@@ -94,8 +253,15 @@ class SessionManager:
             worker = await self.get_available_worker()
             if not worker:
                 break  # No available workers
             # Assign session to worker
             self.session_queue.pop(0)
             session.status = SessionStatus.ACTIVE
@@ -112,6 +278,28 @@ class SessionManager:
             logger.info(f"Assigned session {session_id} to worker {worker.worker_id}")
             # Notify user that their session is starting
             await self.notify_session_start(session)
@@ -199,12 +387,25 @@ class SessionManager:
         session.status = status
         # Free up the worker
         if session.worker_id and session.worker_id in self.workers:
             worker = self.workers[session.worker_id]
             worker.is_available = True
             worker.current_session = None
             # Notify worker to clean up
             try:
                 async with aiohttp.ClientSession() as client_session:
@@ -241,6 +442,11 @@ class SessionManager:
                     })
                 except Exception as e:
                     logger.error(f"Failed to send queue update to session {session_id}: {e}")
     def _calculate_dynamic_wait_time(self, position_in_queue: int) -> float:
         """Calculate dynamic estimated wait time based on current session progress"""
@@ -308,6 +514,7 @@ class SessionManager:
         session = self.sessions.get(session_id)
         if session:
             session.last_activity = time.time()
             if not session.user_has_interacted:
                 session.user_has_interacted = True
                 logger.info(f"User started interacting in session {session_id}")
@@ -335,6 +542,9 @@ session_manager = SessionManager()
 app = FastAPI()
 app.mount("/static", StaticFiles(directory="static"), name="static")
 @app.get("/")
 async def get():
     return HTMLResponse(open("static/index.html").read())
@@ -383,21 +593,39 @@ async def worker_result(result_data: dict):
 @app.websocket("/ws")
 async def websocket_endpoint(websocket: WebSocket):
     await websocket.accept()
-    # Create session
     session_id = str(uuid.uuid4())
-    client_id = f"{int(time.time())}_{session_id[:8]}"
     session = UserSession(
         session_id=session_id,
         client_id=client_id,
         websocket=websocket,
         created_at=time.time(),
-        status=SessionStatus.QUEUED
     )
-    logger.info(f"New WebSocket connection: {client_id}")
     try:
         # Add to queue
@@ -492,10 +720,60 @@ async def periodic_queue_update():
         except Exception as e:
             logger.error(f"Error in periodic queue update: {e}")
 @app.on_event("startup")
 async def startup_event():
     # Start background tasks
     asyncio.create_task(periodic_queue_update())
 if __name__ == "__main__":
     import uvicorn

 import uuid
 import aiohttp
 import logging
+from collections import defaultdict, deque
+from datetime import datetime
 # Configure logging
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
+# Analytics and monitoring
+class SystemAnalytics:
+    def __init__(self):
+        self.start_time = time.time()
+        self.total_connections = 0
+        self.active_connections = 0
+        self.total_interactions = 0
+        self.ip_addresses = defaultdict(int)  # IP -> connection count
+        self.session_durations = deque(maxlen=100)  # Last 100 session durations
+        self.waiting_times = deque(maxlen=100)  # Last 100 waiting times
+        self.users_bypassed_queue = 0  # Users who got GPU immediately
+        self.users_waited_in_queue = 0  # Users who had to wait
+        self.gpu_utilization_samples = deque(maxlen=100)  # GPU utilization over time
+        self.queue_size_samples = deque(maxlen=100)  # Queue size over time
+        self.log_file = None
+        self._init_log_file()
+    def _init_log_file(self):
+        """Initialize the system log file"""
+        timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
+        log_filename = f"system_analytics_{timestamp}.log"
+        self.log_file = log_filename
+        self._write_log("="*80)
+        self._write_log("NEURAL OS MULTI-GPU SYSTEM ANALYTICS")
+        self._write_log("="*80)
+        self._write_log(f"System started at: {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
+        self._write_log("")
+    def _write_log(self, message):
+        """Write message to log file and console"""
+        timestamp = datetime.now().strftime("%H:%M:%S")
+        log_message = f"[{timestamp}] {message}"
+        print(log_message)
+        with open(self.log_file, "a") as f:
+            f.write(log_message + "\n")
+    def log_new_connection(self, client_id: str, ip: str):
+        """Log new connection"""
+        self.total_connections += 1
+        self.active_connections += 1
+        self.ip_addresses[ip] += 1
+        unique_ips = len(self.ip_addresses)
+        self._write_log(f"🔗 NEW CONNECTION: {client_id} from {ip}")
+        self._write_log(f"   📊 Total connections: {self.total_connections} | Active: {self.active_connections} | Unique IPs: {unique_ips}")
+    def log_connection_closed(self, client_id: str, duration: float, interactions: int, reason: str = "normal"):
+        """Log connection closed"""
+        self.active_connections -= 1
+        self.total_interactions += interactions
+        self.session_durations.append(duration)
+        avg_duration = sum(self.session_durations) / len(self.session_durations) if self.session_durations else 0
+        self._write_log(f"🚪 CONNECTION CLOSED: {client_id}")
+        self._write_log(f"   ⏱️  Duration: {duration:.1f}s | Interactions: {interactions} | Reason: {reason}")
+        self._write_log(f"   📊 Active connections: {self.active_connections} | Avg session duration: {avg_duration:.1f}s")
+    def log_queue_bypass(self, client_id: str):
+        """Log when user bypasses queue (gets GPU immediately)"""
+        self.users_bypassed_queue += 1
+        bypass_rate = (self.users_bypassed_queue / self.total_connections) * 100 if self.total_connections > 0 else 0
+        self._write_log(f"⚡ QUEUE BYPASS: {client_id} got GPU immediately")
+        self._write_log(f"   📊 Bypass rate: {bypass_rate:.1f}% ({self.users_bypassed_queue}/{self.total_connections})")
+    def log_queue_wait(self, client_id: str, wait_time: float, queue_position: int):
+        """Log when user had to wait in queue"""
+        self.users_waited_in_queue += 1
+        self.waiting_times.append(wait_time)
+        avg_wait = sum(self.waiting_times) / len(self.waiting_times) if self.waiting_times else 0
+        wait_rate = (self.users_waited_in_queue / self.total_connections) * 100 if self.total_connections > 0 else 0
+        self._write_log(f"⏳ QUEUE WAIT: {client_id} waited {wait_time:.1f}s (was #{queue_position})")
+        self._write_log(f"   📊 Wait rate: {wait_rate:.1f}% | Avg wait time: {avg_wait:.1f}s")
+    def log_gpu_status(self, total_gpus: int, active_gpus: int, available_gpus: int):
+        """Log GPU utilization"""
+        utilization = (active_gpus / total_gpus) * 100 if total_gpus > 0 else 0
+        self.gpu_utilization_samples.append(utilization)
+        avg_utilization = sum(self.gpu_utilization_samples) / len(self.gpu_utilization_samples) if self.gpu_utilization_samples else 0
+        self._write_log(f"🖥️  GPU STATUS: {active_gpus}/{total_gpus} in use ({utilization:.1f}% utilization)")
+        self._write_log(f"   📊 Available: {available_gpus} | Avg utilization: {avg_utilization:.1f}%")
+    def log_worker_registered(self, worker_id: str, gpu_id: int, endpoint: str):
+        """Log when a worker registers"""
+        self._write_log(f"⚙️  WORKER REGISTERED: {worker_id} (GPU {gpu_id}) at {endpoint}")
+    def log_worker_disconnected(self, worker_id: str, gpu_id: int):
+        """Log when a worker disconnects"""
+        self._write_log(f"⚙️  WORKER DISCONNECTED: {worker_id} (GPU {gpu_id})")
+    def log_no_workers_available(self, queue_size: int):
+        """Log critical situation when no workers are available"""
+        self._write_log(f"⚠️  CRITICAL: No GPU workers available! {queue_size} users waiting")
+        self._write_log("   Please check worker processes and GPU availability")
+    def log_queue_status(self, queue_size: int, estimated_wait: float):
+        """Log queue status"""
+        self.queue_size_samples.append(queue_size)
+        avg_queue_size = sum(self.queue_size_samples) / len(self.queue_size_samples) if self.queue_size_samples else 0
+        if queue_size > 0:
+            self._write_log(f"📝 QUEUE STATUS: {queue_size} users waiting | Est. wait: {estimated_wait:.1f}s")
+            self._write_log(f"   📊 Avg queue size: {avg_queue_size:.1f}")
+    def log_periodic_summary(self):
+        """Log periodic system summary"""
+        uptime = time.time() - self.start_time
+        uptime_hours = uptime / 3600
+        unique_ips = len(self.ip_addresses)
+        avg_duration = sum(self.session_durations) / len(self.session_durations) if self.session_durations else 0
+        avg_wait = sum(self.waiting_times) / len(self.waiting_times) if self.waiting_times else 0
+        avg_utilization = sum(self.gpu_utilization_samples) / len(self.gpu_utilization_samples) if self.gpu_utilization_samples else 0
+        avg_queue_size = sum(self.queue_size_samples) / len(self.queue_size_samples) if self.queue_size_samples else 0
+        bypass_rate = (self.users_bypassed_queue / self.total_connections) * 100 if self.total_connections > 0 else 0
+        self._write_log("")
+        self._write_log("="*60)
+        self._write_log("📊 SYSTEM SUMMARY")
+        self._write_log("="*60)
+        self._write_log(f"⏱️  Uptime: {uptime_hours:.1f} hours")
+        self._write_log(f"🔗 Connections: {self.total_connections} total | {self.active_connections} active | {unique_ips} unique IPs")
+        self._write_log(f"💬 Total interactions: {self.total_interactions}")
+        self._write_log(f"⚡ Queue bypass rate: {bypass_rate:.1f}% ({self.users_bypassed_queue}/{self.total_connections})")
+        self._write_log(f"⏳ Avg waiting time: {avg_wait:.1f}s")
+        self._write_log(f"📝 Avg queue size: {avg_queue_size:.1f}")
+        self._write_log(f"🖥️  Avg GPU utilization: {avg_utilization:.1f}%")
+        self._write_log(f"⏱️  Avg session duration: {avg_duration:.1f}s")
+        self._write_log("")
+        self._write_log("🌍 TOP IP ADDRESSES:")
+        for ip, count in sorted(self.ip_addresses.items(), key=lambda x: x[1], reverse=True)[:10]:
+            self._write_log(f"   {ip}: {count} connections")
+        self._write_log("="*60)
+        self._write_log("")
+# Initialize analytics
+analytics = SystemAnalytics()
 class SessionStatus(Enum):
     QUEUED = "queued"
     ACTIVE = "active"
     last_activity: Optional[float] = None
     max_session_time: Optional[float] = None
     user_has_interacted: bool = False
+    ip_address: Optional[str] = None
+    interaction_count: int = 0
+    queue_start_time: Optional[float] = None
 @dataclass
 class WorkerInfo:
             last_ping=time.time()
         )
         logger.info(f"Registered worker {worker_id} on GPU {gpu_id} at {endpoint}")
+        # Log worker registration
+        analytics.log_worker_registered(worker_id, gpu_id, endpoint)
+        # Log GPU status
+        total_gpus = len(self.workers)
+        active_gpus = len([w for w in self.workers.values() if not w.is_available])
+        available_gpus = total_gpus - active_gpus
+        analytics.log_gpu_status(total_gpus, active_gpus, available_gpus)
     async def get_available_worker(self) -> Optional[WorkerInfo]:
         """Get an available worker"""
         self.sessions[session.session_id] = session
         self.session_queue.append(session.session_id)
         session.status = SessionStatus.QUEUED
+        session.queue_start_time = time.time()
         logger.info(f"Added session {session.session_id} to queue. Queue size: {len(self.session_queue)}")
     async def process_queue(self):
             worker = await self.get_available_worker()
             if not worker:
+                # Log critical situation if no workers are available
+                if len(self.workers) == 0:
+                    analytics.log_no_workers_available(len(self.session_queue))
                 break  # No available workers
+            # Calculate wait time
+            wait_time = time.time() - session.queue_start_time if session.queue_start_time else 0
+            queue_position = self.session_queue.index(session_id) + 1
             # Assign session to worker
             self.session_queue.pop(0)
             session.status = SessionStatus.ACTIVE
             logger.info(f"Assigned session {session_id} to worker {worker.worker_id}")
+            # Log analytics
+            if wait_time > 0:
+                analytics.log_queue_wait(session.client_id, wait_time, queue_position)
+            else:
+                analytics.log_queue_bypass(session.client_id)
+            # Log GPU status
+            total_gpus = len(self.workers)
+            active_gpus = len([w for w in self.workers.values() if not w.is_available])
+            available_gpus = total_gpus - active_gpus
+            analytics.log_gpu_status(total_gpus, active_gpus, available_gpus)
+            # Initialize session on worker with client_id for logging
+            try:
+                async with aiohttp.ClientSession() as client_session:
+                    await client_session.post(f"{worker.endpoint}/init_session", json={
+                        "session_id": session_id,
+                        "client_id": session.client_id
+                    })
+            except Exception as e:
+                logger.error(f"Failed to initialize session on worker {worker.worker_id}: {e}")
             # Notify user that their session is starting
             await self.notify_session_start(session)
         session.status = status
+        # Calculate session duration
+        duration = time.time() - session.created_at
+        # Log analytics
+        reason = "timeout" if status == SessionStatus.TIMEOUT else "normal"
+        analytics.log_connection_closed(session.client_id, duration, session.interaction_count, reason)
         # Free up the worker
         if session.worker_id and session.worker_id in self.workers:
             worker = self.workers[session.worker_id]
             worker.is_available = True
             worker.current_session = None
+            # Log GPU status
+            total_gpus = len(self.workers)
+            active_gpus = len([w for w in self.workers.values() if not w.is_available])
+            available_gpus = total_gpus - active_gpus
+            analytics.log_gpu_status(total_gpus, active_gpus, available_gpus)
             # Notify worker to clean up
             try:
                 async with aiohttp.ClientSession() as client_session:
                     })
                 except Exception as e:
                     logger.error(f"Failed to send queue update to session {session_id}: {e}")
+        # Log queue status if there's a queue
+        if self.session_queue:
+            estimated_wait = self._calculate_dynamic_wait_time(1)
+            analytics.log_queue_status(len(self.session_queue), estimated_wait)
     def _calculate_dynamic_wait_time(self, position_in_queue: int) -> float:
         """Calculate dynamic estimated wait time based on current session progress"""
         session = self.sessions.get(session_id)
         if session:
             session.last_activity = time.time()
+            session.interaction_count += 1
             if not session.user_has_interacted:
                 session.user_has_interacted = True
                 logger.info(f"User started interacting in session {session_id}")
 app = FastAPI()
 app.mount("/static", StaticFiles(directory="static"), name="static")
+# Global connection counter like in main.py
+connection_counter = 0
 @app.get("/")
 async def get():
     return HTMLResponse(open("static/index.html").read())
 @app.websocket("/ws")
 async def websocket_endpoint(websocket: WebSocket):
+    global connection_counter
     await websocket.accept()
+    # Extract client IP address
+    client_ip = "unknown"
+    if websocket.client and hasattr(websocket.client, 'host'):
+        client_ip = websocket.client.host
+    elif hasattr(websocket, 'headers'):
+        # Try to get real IP from headers (for proxy setups)
+        client_ip = websocket.headers.get('x-forwarded-for',
+                     websocket.headers.get('x-real-ip',
+                     websocket.headers.get('cf-connecting-ip', 'unknown')))
+        if ',' in client_ip:
+            client_ip = client_ip.split(',')[0].strip()
+    # Create session with connection counter like in main.py
+    connection_counter += 1
     session_id = str(uuid.uuid4())
+    client_id = f"{int(time.time())}_{connection_counter}"
     session = UserSession(
         session_id=session_id,
         client_id=client_id,
         websocket=websocket,
         created_at=time.time(),
+        status=SessionStatus.QUEUED,
+        ip_address=client_ip
     )
+    logger.info(f"New WebSocket connection: {client_id} from {client_ip}")
+    # Log new connection analytics
+    analytics.log_new_connection(client_id, client_ip)
     try:
         # Add to queue
         except Exception as e:
             logger.error(f"Error in periodic queue update: {e}")
+# Background task to periodically log analytics summary
+async def periodic_analytics_summary():
+    while True:
+        try:
+            await asyncio.sleep(300)  # Log summary every 5 minutes
+            analytics.log_periodic_summary()
+        except Exception as e:
+            logger.error(f"Error in periodic analytics summary: {e}")
+# Background task to check worker health
+async def periodic_worker_health_check():
+    while True:
+        try:
+            await asyncio.sleep(60)  # Check every minute
+            current_time = time.time()
+            disconnected_workers = []
+            for worker_id, worker in list(session_manager.workers.items()):
+                if current_time - worker.last_ping > 30:  # 30 second timeout
+                    disconnected_workers.append((worker_id, worker.gpu_id))
+            for worker_id, gpu_id in disconnected_workers:
+                analytics.log_worker_disconnected(worker_id, gpu_id)
+                del session_manager.workers[worker_id]
+                logger.warning(f"Removed disconnected worker {worker_id} (GPU {gpu_id})")
+            if disconnected_workers:
+                # Log updated GPU status
+                total_gpus = len(session_manager.workers)
+                active_gpus = len([w for w in session_manager.workers.values() if not w.is_available])
+                available_gpus = total_gpus - active_gpus
+                analytics.log_gpu_status(total_gpus, active_gpus, available_gpus)
+        except Exception as e:
+            logger.error(f"Error in periodic worker health check: {e}")
 @app.on_event("startup")
 async def startup_event():
     # Start background tasks
     asyncio.create_task(periodic_queue_update())
+    asyncio.create_task(periodic_analytics_summary())
+    asyncio.create_task(periodic_worker_health_check())
+    # Log initial system status
+    analytics._write_log("🚀 System initialized and ready to accept connections")
+    analytics._write_log("   Waiting for GPU workers to register...")
+@app.on_event("shutdown")
+async def shutdown_event():
+    # Log final system summary
+    analytics._write_log("")
+    analytics._write_log("🛑 System shutting down...")
+    analytics.log_periodic_summary()
+    analytics._write_log("System shutdown complete.")
 if __name__ == "__main__":
     import uvicorn

main.py CHANGED Viewed

@@ -526,7 +526,9 @@ async def websocket_endpoint(websocket: WebSocket):
                     if not user_has_interacted:
                         user_has_interacted = True
                         print(f"[{time.perf_counter():.3f}] User has started interacting with canvas for client {client_id}")
-                print(f'[{time.perf_counter():.3f}] Processing: x: {x}, y: {y}, is_left_click: {is_left_click}, is_right_click: {is_right_click}, keys_down_list: {keys_down_list}, keys_up_list: {keys_up_list}, time_since_activity: {time.perf_counter() - last_user_activity_time:.3f}')
                 # Update the set based on the received data
                 for key in keys_down_list:
@@ -649,7 +651,9 @@ async def websocket_endpoint(websocket: WebSocket):
                     is_interesting = (current_input.get("is_left_click") or
                                       current_input.get("is_right_click") or
                                       (current_input.get("keys_down") and len(current_input.get("keys_down")) > 0) or
-                                      (current_input.get("keys_up") and len(current_input.get("keys_up")) > 0))
                     # Process immediately if interesting
                     if is_interesting:
@@ -802,6 +806,8 @@ def log_interaction(client_id, data, generated_frame=None, is_end_of_session=Fal
             "is_right_click": data.get("is_right_click"),
             "keys_down": data.get("keys_down", []),
             "keys_up": data.get("keys_up", []),
             "is_auto_input": data.get("is_auto_input", False)
         }
     else:
@@ -809,6 +815,8 @@ def log_interaction(client_id, data, generated_frame=None, is_end_of_session=Fal
         log_entry["inputs"] = None
     # Save to a file (one file per session)
     session_file = f"interaction_logs/session_{client_id}.jsonl"
     with open(session_file, "a") as f:
         f.write(json.dumps(log_entry) + "\n")

                     if not user_has_interacted:
                         user_has_interacted = True
                         print(f"[{time.perf_counter():.3f}] User has started interacting with canvas for client {client_id}")
+                wheel_delta_x = data.get("wheel_delta_x", 0)
+                wheel_delta_y = data.get("wheel_delta_y", 0)
+                print(f'[{time.perf_counter():.3f}] Processing: x: {x}, y: {y}, is_left_click: {is_left_click}, is_right_click: {is_right_click}, keys_down_list: {keys_down_list}, keys_up_list: {keys_up_list}, wheel: ({wheel_delta_x},{wheel_delta_y}), time_since_activity: {time.perf_counter() - last_user_activity_time:.3f}')
                 # Update the set based on the received data
                 for key in keys_down_list:
                     is_interesting = (current_input.get("is_left_click") or
                                       current_input.get("is_right_click") or
                                       (current_input.get("keys_down") and len(current_input.get("keys_down")) > 0) or
+                                      (current_input.get("keys_up") and len(current_input.get("keys_up")) > 0) or
+                                      current_input.get("wheel_delta_x", 0) != 0 or
+                                      current_input.get("wheel_delta_y", 0) != 0)
                     # Process immediately if interesting
                     if is_interesting:
             "is_right_click": data.get("is_right_click"),
             "keys_down": data.get("keys_down", []),
             "keys_up": data.get("keys_up", []),
+            "wheel_delta_x": data.get("wheel_delta_x", 0),
+            "wheel_delta_y": data.get("wheel_delta_y", 0),
             "is_auto_input": data.get("is_auto_input", False)
         }
     else:
         log_entry["inputs"] = None
     # Save to a file (one file per session)
+    if not os.path.exists("interaction_logs"):
+        os.makedirs("interaction_logs", exist_ok=True)
     session_file = f"interaction_logs/session_{client_id}.jsonl"
     with open(session_file, "a") as f:
         f.write(json.dumps(log_entry) + "\n")

start_system.sh CHANGED Viewed

@@ -61,6 +61,7 @@ echo "========================================"
 echo "📊 Number of GPUs: $NUM_GPUS"
 echo "🌐 Dispatcher port: $DISPATCHER_PORT"
 echo "💻 Worker ports: $(seq -s', ' 8001 $((8000 + NUM_GPUS)))"
 echo ""
 # Check if required files exist
@@ -130,12 +131,14 @@ for ((i=0; i<NUM_GPUS; i++)); do
 done
 echo ""
 echo "📋 Log files:"
 echo "   Dispatcher: dispatcher.log"
 echo "   Workers summary: workers.log"
 for ((i=0; i<NUM_GPUS; i++)); do
     echo "   GPU $i worker: worker_gpu_$i.log"
 done
 echo ""
 echo "Press Ctrl+C to stop the system"
 echo "================================"

 echo "📊 Number of GPUs: $NUM_GPUS"
 echo "🌐 Dispatcher port: $DISPATCHER_PORT"
 echo "💻 Worker ports: $(seq -s', ' 8001 $((8000 + NUM_GPUS)))"
+echo "📈 Analytics logging: system_analytics_$(date +%Y%m%d_%H%M%S).log"
 echo ""
 # Check if required files exist
 done
 echo ""
 echo "📋 Log files:"
+echo "   System analytics: system_analytics_*.log (real-time monitoring)"
 echo "   Dispatcher: dispatcher.log"
 echo "   Workers summary: workers.log"
 for ((i=0; i<NUM_GPUS; i++)); do
     echo "   GPU $i worker: worker_gpu_$i.log"
 done
 echo ""
+echo "💡 Monitor system in real-time: tail -f system_analytics_*.log"
 echo "Press Ctrl+C to stop the system"
 echo "================================"

static/index.html CHANGED Viewed

@@ -414,6 +414,8 @@
                             "is_right_click": false,
                             "keys_down": [],
                             "keys_up": [],
                             "is_auto_input": true  // Flag to identify auto-generated inputs
                         }));
                         lastAutoInputTime = currentTime;
@@ -531,7 +533,9 @@
                         "is_left_click": false,
                         "is_right_click": false,
                         "keys_down": [],
-                        "keys_up": []
                     }));
                     updateLastUserInputTime(); // Update for auto-input mechanism
                 } catch (error) {
@@ -541,9 +545,9 @@
             stopTimeoutCountdown();
         }
-        function sendInputState(x, y, isLeftClick = false, isRightClick = false, keysDownArr = [], keysUpArr = []) {
             const currentTime = Date.now();
-            if (isConnected && socket.readyState === WebSocket.OPEN && (isLeftClick || isRightClick || keysDownArr.length > 0 || keysUpArr.length > 0 || !lastSentPosition || currentTime - lastSentTime >= SEND_INTERVAL)) {
                 try {
                     socket.send(JSON.stringify({
                         "x": x,
@@ -552,6 +556,8 @@
                         "is_right_click": isRightClick,
                         "keys_down": keysDownArr,
                         "keys_up": keysUpArr,
                     }));
                     lastSentPosition = { x, y };
                     lastSentTime = currentTime;
@@ -638,6 +644,27 @@
             sendInputState(x, y, false, true);
         });
         // Track keyboard events
         const TROUBLESOME = new Set([
             "Tab",          // focus change

                             "is_right_click": false,
                             "keys_down": [],
                             "keys_up": [],
+                            "wheel_delta_x": 0,
+                            "wheel_delta_y": 0,
                             "is_auto_input": true  // Flag to identify auto-generated inputs
                         }));
                         lastAutoInputTime = currentTime;
                         "is_left_click": false,
                         "is_right_click": false,
                         "keys_down": [],
+                        "keys_up": [],
+                        "wheel_delta_x": 0,
+                        "wheel_delta_y": 0
                     }));
                     updateLastUserInputTime(); // Update for auto-input mechanism
                 } catch (error) {
             stopTimeoutCountdown();
         }
+        function sendInputState(x, y, isLeftClick = false, isRightClick = false, keysDownArr = [], keysUpArr = [], wheelDeltaX = 0, wheelDeltaY = 0) {
             const currentTime = Date.now();
+            if (isConnected && socket.readyState === WebSocket.OPEN && (isLeftClick || isRightClick || keysDownArr.length > 0 || keysUpArr.length > 0 || wheelDeltaX !== 0 || wheelDeltaY !== 0 || !lastSentPosition || currentTime - lastSentTime >= SEND_INTERVAL)) {
                 try {
                     socket.send(JSON.stringify({
                         "x": x,
                         "is_right_click": isRightClick,
                         "keys_down": keysDownArr,
                         "keys_up": keysUpArr,
+                        "wheel_delta_x": wheelDeltaX,
+                        "wheel_delta_y": wheelDeltaY,
                     }));
                     lastSentPosition = { x, y };
                     lastSentTime = currentTime;
             sendInputState(x, y, false, true);
         });
+        // Handle mouse wheel events
+        canvas.addEventListener("wheel", function (event) {
+            event.preventDefault(); // Prevent page scrolling
+            if (!isConnected || isProcessing) return;
+            let rect = canvas.getBoundingClientRect();
+            let x = event.clientX - rect.left;
+            let y = event.clientY - rect.top;
+            // Normalize wheel delta values (different browsers handle this differently)
+            let deltaX = event.deltaX;
+            let deltaY = event.deltaY;
+            // Clamp values to reasonable range
+            //deltaX = Math.max(-10, Math.min(10, deltaX));
+            //deltaY = Math.max(-10, Math.min(10, deltaY));
+            console.log(`Wheel event: deltaX=${deltaX}, deltaY=${deltaY} at (${x}, ${y})`);
+            sendInputState(x, y, false, false, [], [], deltaX, deltaY);
+        });
         // Track keyboard events
         const TROUBLESOME = new Set([
             "Tab",          // focus change

worker.py CHANGED Viewed

@@ -293,9 +293,17 @@ class GPUWorker:
         return sample_latent, sample_img, hidden_states, timing
-    def initialize_session(self, session_id: str):
         """Initialize a new session"""
         self.current_session = session_id
         self.session_data[session_id] = {
             'previous_frame': self.padding_image,
             'hidden_states': None,
@@ -306,9 +314,10 @@ class GPUWorker:
                 'sampling_steps': self.NUM_SAMPLING_STEPS
             },
             'input_queue': asyncio.Queue(),
-            'is_processing': False
         }
-        logger.info(f"Initialized session {session_id}")
         # Start processing task for this session
         asyncio.create_task(self._process_session_queue(session_id))
@@ -316,8 +325,12 @@ class GPUWorker:
     def end_session(self, session_id: str):
         """End a session and clean up"""
         if session_id in self.session_data:
-            # Clear any remaining items in the queue
             session = self.session_data[session_id]
             while not session['input_queue'].empty():
                 try:
                     session['input_queue'].get_nowait()
@@ -391,7 +404,9 @@ class GPUWorker:
                 is_interesting = (current_input.get("is_left_click") or
                                   current_input.get("is_right_click") or
                                   (current_input.get("keys_down") and len(current_input.get("keys_down")) > 0) or
-                                  (current_input.get("keys_up") and len(current_input.get("keys_up")) > 0))
                 # Process immediately if interesting
                 if is_interesting:
@@ -416,13 +431,17 @@ class GPUWorker:
     async def process_input(self, session_id: str, data: dict) -> dict:
         """Process input for a session - adds to queue or handles control messages"""
         if session_id not in self.session_data:
-            self.initialize_session(session_id)
         session = self.session_data[session_id]
         # Handle control messages immediately (don't queue these)
         if data.get("type") == "reset":
             logger.info(f"Received reset command for session {session_id}")
             # Clear the queue
             while not session['input_queue'].empty():
                 try:
@@ -484,6 +503,8 @@ class GPUWorker:
             is_right_click = data.get("is_right_click", False)
             keys_down_list = data.get("keys_down", [])
             keys_up_list = data.get("keys_up", [])
             # Update keys_down set
             for key in keys_down_list:
@@ -518,8 +539,13 @@ class GPUWorker:
                 session['frame_num']
             )
             # Process frame
-            logger.info(f"Processing frame {session['frame_num']} for session {session_id}")
             sample_latent, sample_img, hidden_states, timing_info = await self.process_frame(
                 inputs,
                 use_rnn=session['client_settings']['use_rnn'],
@@ -539,6 +565,10 @@ class GPUWorker:
             # Log timing
             logger.info(f"Frame {session['frame_num']} processed in {timing_info['total']:.4f}s (FPS: {1.0/timing_info['total']:.2f})")
             # Send result back to dispatcher
             await self._send_result_to_dispatcher(session_id, {"image": img_str})
@@ -566,6 +596,55 @@ app = FastAPI()
 # Global worker instance
 worker: Optional[GPUWorker] = None
 @app.post("/process_input")
 async def process_input_endpoint(request: dict):
     """Process input from dispatcher"""
@@ -581,13 +660,29 @@ async def process_input_endpoint(request: dict):
     result = await worker.process_input(session_id, data)
     return result
 @app.post("/end_session")
 async def end_session_endpoint(request: dict):
-    """End a session"""
     if not worker:
         raise HTTPException(status_code=500, detail="Worker not initialized")
     session_id = request.get("session_id")
     if not session_id:
         raise HTTPException(status_code=400, detail="Missing session_id")

         return sample_latent, sample_img, hidden_states, timing
+    def initialize_session(self, session_id: str, client_id: str = None):
         """Initialize a new session"""
         self.current_session = session_id
+        # Use client_id from dispatcher if provided, otherwise create one
+        if client_id:
+            log_session_id = client_id
+        else:
+            # Fallback: create a time-prefixed session identifier for logging
+            session_start_time = int(time.time())
+            log_session_id = f"{session_start_time}_{session_id}"
         self.session_data[session_id] = {
             'previous_frame': self.padding_image,
             'hidden_states': None,
                 'sampling_steps': self.NUM_SAMPLING_STEPS
             },
             'input_queue': asyncio.Queue(),
+            'is_processing': False,
+            'log_session_id': log_session_id  # Store the time-prefixed ID for logging
         }
+        logger.info(f"Initialized session {session_id} with log ID {log_session_id}")
         # Start processing task for this session
         asyncio.create_task(self._process_session_queue(session_id))
     def end_session(self, session_id: str):
         """End a session and clean up"""
         if session_id in self.session_data:
+            # Log session end using the stored log_session_id
             session = self.session_data[session_id]
+            log_session_id = session.get('log_session_id', session_id)  # Fallback to session_id if not found
+            log_interaction(log_session_id, {}, is_end_of_session=True)
+            # Clear any remaining items in the queue
             while not session['input_queue'].empty():
                 try:
                     session['input_queue'].get_nowait()
                 is_interesting = (current_input.get("is_left_click") or
                                   current_input.get("is_right_click") or
                                   (current_input.get("keys_down") and len(current_input.get("keys_down")) > 0) or
+                                  (current_input.get("keys_up") and len(current_input.get("keys_up")) > 0) or
+                                  current_input.get("wheel_delta_x", 0) != 0 or
+                                  current_input.get("wheel_delta_y", 0) != 0)
                 # Process immediately if interesting
                 if is_interesting:
     async def process_input(self, session_id: str, data: dict) -> dict:
         """Process input for a session - adds to queue or handles control messages"""
         if session_id not in self.session_data:
+            self.initialize_session(session_id)  # Fallback initialization without client_id
         session = self.session_data[session_id]
         # Handle control messages immediately (don't queue these)
         if data.get("type") == "reset":
             logger.info(f"Received reset command for session {session_id}")
+            # Log the reset action using the stored log_session_id
+            log_session_id = session.get('log_session_id', session_id)  # Fallback to session_id if not found
+            log_interaction(log_session_id, data, is_reset=True)
             # Clear the queue
             while not session['input_queue'].empty():
                 try:
             is_right_click = data.get("is_right_click", False)
             keys_down_list = data.get("keys_down", [])
             keys_up_list = data.get("keys_up", [])
+            wheel_delta_x = data.get("wheel_delta_x", 0)
+            wheel_delta_y = data.get("wheel_delta_y", 0)
             # Update keys_down set
             for key in keys_down_list:
                 session['frame_num']
             )
+            # Log the input data being processed
+            logger.info(f"Processing frame {session['frame_num']} for session {session_id}: "
+                       f"pos=({x},{y}), clicks=(L:{is_left_click},R:{is_right_click}), "
+                       f"keys_down={keys_down_list}, keys_up={keys_up_list}, "
+                       f"wheel=({wheel_delta_x},{wheel_delta_y})")
             # Process frame
             sample_latent, sample_img, hidden_states, timing_info = await self.process_frame(
                 inputs,
                 use_rnn=session['client_settings']['use_rnn'],
             # Log timing
             logger.info(f"Frame {session['frame_num']} processed in {timing_info['total']:.4f}s (FPS: {1.0/timing_info['total']:.2f})")
+            # Log the interaction using the stored log_session_id
+            log_session_id = session.get('log_session_id', session_id)  # Fallback to session_id if not found
+            log_interaction(log_session_id, data, generated_frame=sample_img)
             # Send result back to dispatcher
             await self._send_result_to_dispatcher(session_id, {"image": img_str})
 # Global worker instance
 worker: Optional[GPUWorker] = None
+def log_interaction(log_session_id, data, generated_frame=None, is_end_of_session=False, is_reset=False):
+    """Log user interaction and optionally the generated frame."""
+    timestamp = time.time()
+    # Create directory structure if it doesn't exist
+    os.makedirs("interaction_logs", exist_ok=True)
+    # Structure the log entry
+    log_entry = {
+        "timestamp": timestamp,
+        "session_id": log_session_id,  # Use the time-prefixed session ID
+        "is_eos": is_end_of_session,
+        "is_reset": is_reset
+    }
+    # Include type if present (for reset, etc.)
+    if data.get("type"):
+        log_entry["type"] = data.get("type")
+    # Only include input data if this isn't just a control message
+    if not is_end_of_session and not is_reset:
+        log_entry["inputs"] = {
+            "x": data.get("x"),
+            "y": data.get("y"),
+            "is_left_click": data.get("is_left_click"),
+            "is_right_click": data.get("is_right_click"),
+            "keys_down": data.get("keys_down", []),
+            "keys_up": data.get("keys_up", []),
+            "wheel_delta_x": data.get("wheel_delta_x", 0),
+            "wheel_delta_y": data.get("wheel_delta_y", 0),
+            "is_auto_input": data.get("is_auto_input", False)
+        }
+    else:
+        # For EOS/reset records, just include minimal info
+        log_entry["inputs"] = None
+    # Use the time-prefixed session ID for the filename (already includes timestamp)
+    session_file = f"interaction_logs/session_{log_session_id}.jsonl"
+    with open(session_file, "a") as f:
+        f.write(json.dumps(log_entry) + "\n")
+    # Optionally save the frame if provided
+    if generated_frame is not None and not is_end_of_session and not is_reset:
+        frame_dir = f"interaction_logs/frames_{log_session_id}"
+        os.makedirs(frame_dir, exist_ok=True)
+        frame_file = f"{frame_dir}/{timestamp:.6f}.png"
+        # Save the frame as PNG
+        Image.fromarray(generated_frame).save(frame_file)
 @app.post("/process_input")
 async def process_input_endpoint(request: dict):
     """Process input from dispatcher"""
     result = await worker.process_input(session_id, data)
     return result
+@app.post("/init_session")
+async def init_session_endpoint(request: dict):
+    """Initialize session from dispatcher with client_id"""
+    if not worker:
+        raise HTTPException(status_code=500, detail="Worker not initialized")
+    session_id = request.get("session_id")
+    client_id = request.get("client_id")
+    if not session_id:
+        raise HTTPException(status_code=400, detail="Missing session_id")
+    worker.initialize_session(session_id, client_id)
+    return {"status": "session_initialized"}
 @app.post("/end_session")
 async def end_session_endpoint(request: dict):
+    """End session from dispatcher"""
     if not worker:
         raise HTTPException(status_code=500, detail="Worker not initialized")
     session_id = request.get("session_id")
     if not session_id:
         raise HTTPException(status_code=400, detail="Missing session_id")