Spaces:

DawnC
/

VisionScout

Running on Zero

App Files Files Community

DawnC commited on Jun 17

Commit

6074c5d

verified ·

1 Parent(s): 3357fb4

Upload enhanced_scene_describer.py

Browse files

Files changed (1) hide show

enhanced_scene_describer.py +18 -33

enhanced_scene_describer.py CHANGED Viewed

@@ -123,7 +123,7 @@ class EnhancedSceneDescriber:
     def generate_description(self, scene_type: str, detected_objects: List[Dict], confidence: float,
                            lighting_info: Dict, functional_zones: List[str], enable_landmark: bool = True,
                            scene_scores: Optional[Dict] = None, spatial_analysis: Optional[Dict] = None,
-                           image_dimensions: Optional[Tuple[int, int]] = None, # 改為 Tuple
                            places365_info: Optional[Dict] = None,
                            object_statistics: Optional[Dict] = None) -> str:
         try:
@@ -815,47 +815,36 @@ class EnhancedSceneDescriber:
                           max_categories_to_return: Optional[int] = None,
                           max_total_objects: Optional[int] = None) -> List[Dict]:
         """
-        獲取最重要的物件
-        Args:
-            detected_objects: 檢測到的物件列表
-            min_prominence_score: 最小重要性分數閾值，預設為0.5
-            max_categories_to_return: 可選的最大返回類別數量限制
-            max_total_objects: 可選的最大返回物件總數限制
-        Returns:
-            List[Dict]: 重要物件列表
         """
         try:
-            # 傳遞所有參數
             prominent_objects = self.object_description_generator.get_prominent_objects(
                 detected_objects,
                 min_prominence_score,
-                max_categories_to_return
             )
-            # 如果指定了最大物件總數限制，進行額外過濾
             if max_total_objects is not None and max_total_objects > 0:
-                # 限制總物件數量，保持重要性排序
                 prominent_objects = prominent_objects[:max_total_objects]
-            # 如果指定了最大類別數量限制，則進行額外過濾
             if max_categories_to_return is not None and max_categories_to_return > 0:
-                # 按類別分組物件
                 categories_seen = set()
                 filtered_objects = []
                 for obj in prominent_objects:
                     class_name = obj.get("class_name", "unknown")
                     if class_name not in categories_seen:
-                        categories_seen.add(class_name)
-                        filtered_objects.append(obj)
-                        # 如果已達到最大類別數量，停止添加新類別
-                        if len(categories_seen) >= max_categories_to_return:
-                            break
-                    elif class_name in categories_seen:
-                        # 如果是已見過的類別，仍然添加該物件
                         filtered_objects.append(obj)
                 return filtered_objects
@@ -1033,9 +1022,11 @@ class EnhancedSceneDescriber:
         Returns:
             模板內容
-        """
         return self.template_manager.get_template(category, key)
     def get_viewpoint_confidence(self, detected_objects: List[Dict]) -> Tuple[str, float]:
         """
         獲取視角檢測結果及其信心度
@@ -1105,12 +1096,6 @@ class EnhancedSceneDescriber:
             self.logger.warning(f"Error getting text statistics: {str(e)}")
             return {"characters": 0, "words": 0, "sentences": 0}
-    def reload_templates(self):
-        """
-        重新載入所有模板
-        """
-        self.template_manager.reload_templates()
     def get_configuration(self) -> Dict[str, Any]:
         """
         獲取當前配置信息
@@ -1138,4 +1123,4 @@ class EnhancedSceneDescriber:
                 region_analyzer=self.region_analyzer
             )
         except Exception as e:
-            self.logger.error(f"Fallback component initialization failed: {str(e)}")

     def generate_description(self, scene_type: str, detected_objects: List[Dict], confidence: float,
                            lighting_info: Dict, functional_zones: List[str], enable_landmark: bool = True,
                            scene_scores: Optional[Dict] = None, spatial_analysis: Optional[Dict] = None,
+                           image_dimensions: Optional[Tuple[int, int]] = None,
                            places365_info: Optional[Dict] = None,
                            object_statistics: Optional[Dict] = None) -> str:
         try:
                           max_categories_to_return: Optional[int] = None,
                           max_total_objects: Optional[int] = None) -> List[Dict]:
         """
+        獲取最重要的物件，避免重複過濾邏輯
         """
         try:
+            # 第一步：獲取基礎的重要物件
             prominent_objects = self.object_description_generator.get_prominent_objects(
                 detected_objects,
                 min_prominence_score,
+                max_categories_to_return=None
             )
+            # 第二步：應用總數限制
             if max_total_objects is not None and max_total_objects > 0:
                 prominent_objects = prominent_objects[:max_total_objects]
+            # 第三步：應用objects限制
             if max_categories_to_return is not None and max_categories_to_return > 0:
                 categories_seen = set()
                 filtered_objects = []
                 for obj in prominent_objects:
                     class_name = obj.get("class_name", "unknown")
+                    # 如果是新類別且未達到限制
                     if class_name not in categories_seen:
+                        if len(categories_seen) < max_categories_to_return:
+                            categories_seen.add(class_name)
+                            filtered_objects.append(obj)
+                        # 如果已達到類別限制，跳過新類別的物件
+                    else:
+                        # 直接添加已見過的objects
                         filtered_objects.append(obj)
                 return filtered_objects
         Returns:
             模板內容
+        """
         return self.template_manager.get_template(category, key)
     def get_viewpoint_confidence(self, detected_objects: List[Dict]) -> Tuple[str, float]:
         """
         獲取視角檢測結果及其信心度
             self.logger.warning(f"Error getting text statistics: {str(e)}")
             return {"characters": 0, "words": 0, "sentences": 0}
     def get_configuration(self) -> Dict[str, Any]:
         """
         獲取當前配置信息
                 region_analyzer=self.region_analyzer
             )
         except Exception as e:
+            self.logger.error(f"Fallback component initialization failed: {str(e)}")