Spaces:

CCockrum
/

Smart-Data-Profiler

Sleeping

App Files Files Community

CCockrum commited on 11 days ago

Commit

33a0119

verified ·

1 Parent(s): d2a16c1

Update app.py

Browse files

Files changed (1) hide show

app.py +13 -22

app.py CHANGED Viewed

@@ -256,14 +256,13 @@ class OutlierDetective:
         self.outlier_results = results
         return results
-    def generate_outlier_report(self) -> str:
         """Generate comprehensive outlier analysis report"""
         if not self.outlier_results:
             return "No outlier analysis results available. Please run the analysis first."
         report = "#Outlier Detection Report\n\n"
-        # Summary statistics
         total_outliers_by_method = {}
         all_outlier_indices = set()
@@ -273,14 +272,11 @@ class OutlierDetective:
             for method, result in methods.items():
                 if isinstance(result, dict) and 'outlier_count' in result:
-                    if method not in total_outliers_by_method:
-                        total_outliers_by_method[method] = 0
                     total_outliers_by_method[method] += result['outlier_count']
                     if 'outlier_indices' in result:
                         all_outlier_indices.update(result['outlier_indices'])
-        # Add multivariate results
         if 'Multivariate' in self.outlier_results:
             for method, result in self.outlier_results['Multivariate'].items():
                 if isinstance(result, dict) and 'outlier_count' in result:
@@ -297,19 +293,15 @@ class OutlierDetective:
         for method, count in total_outliers_by_method.items():
             report += f"- **{method}:** {count} outliers\n"
-        report += "\n"
-        # Detailed results by column
-        report += "## Detailed Results\n\n"
         for column, methods in self.outlier_results.items():
             if column == 'Multivariate':
                 continue
-            report += f"### Column: `{column}`\n\n"
             for method, result in methods.items():
-                if not isinstance(result, dict) or 'outlier_count' in result and result['outlier_count'] == 0:
                     report += f"**{method}:** No outliers detected\n"
                     continue
@@ -317,23 +309,22 @@ class OutlierDetective:
                 report += f"- Outliers found: {result['outlier_count']} ({result['outlier_percentage']:.2f}%)\n"
                 report += f"- Explanation: {result['explanation']}\n"
-                # Show some example outlier values
                 if 'outlier_values' in result and result['outlier_values']:
-                    sample_values = result['outlier_values'][:5]  # Show first 5
-                    report += f"- Example outliers: {', '.join([f'{v:.3f}' if isinstance(v, (int, float)) else str(v) for v in sample_values])}"
                     if len(result['outlier_values']) > 5:
                         report += f" (and {len(result['outlier_values']) - 5} more)"
                     report += "\n"
                 report += "\n"
-        # Multivariate results
         if 'Multivariate' in self.outlier_results:
             report += "### Multivariate Analysis\n\n"
             for method, result in self.outlier_results['Multivariate'].items():
-                if not isinstance(result, dict):
                     continue
                 report += f"**{method}:**\n"
-                report += f"- Outliers found: {result['outli

         self.outlier_results = results
         return results
+       def generate_outlier_report(self) -> str:
         """Generate comprehensive outlier analysis report"""
         if not self.outlier_results:
             return "No outlier analysis results available. Please run the analysis first."
         report = "#Outlier Detection Report\n\n"
         total_outliers_by_method = {}
         all_outlier_indices = set()
             for method, result in methods.items():
                 if isinstance(result, dict) and 'outlier_count' in result:
+                    total_outliers_by_method.setdefault(method, 0)
                     total_outliers_by_method[method] += result['outlier_count']
                     if 'outlier_indices' in result:
                         all_outlier_indices.update(result['outlier_indices'])
         if 'Multivariate' in self.outlier_results:
             for method, result in self.outlier_results['Multivariate'].items():
                 if isinstance(result, dict) and 'outlier_count' in result:
         for method, count in total_outliers_by_method.items():
             report += f"- **{method}:** {count} outliers\n"
+        report += "\n## Detailed Results\n\n"
         for column, methods in self.outlier_results.items():
             if column == 'Multivariate':
                 continue
+            report += f"### Column: `{column}`\n\n"
             for method, result in methods.items():
+                if not isinstance(result, dict) or ('outlier_count' in result and result['outlier_count'] == 0):
                     report += f"**{method}:** No outliers detected\n"
                     continue
                 report += f"- Outliers found: {result['outlier_count']} ({result['outlier_percentage']:.2f}%)\n"
                 report += f"- Explanation: {result['explanation']}\n"
                 if 'outlier_values' in result and result['outlier_values']:
+                    sample_values = result['outlier_values'][:5]
+                    formatted_values = ', '.join([f'{v:.3f}' if isinstance(v, (int, float)) else str(v) for v in sample_values])
+                    report += f"- Example outliers: {formatted_values}"
                     if len(result['outlier_values']) > 5:
                         report += f" (and {len(result['outlier_values']) - 5} more)"
                     report += "\n"
                 report += "\n"
         if 'Multivariate' in self.outlier_results:
             report += "### Multivariate Analysis\n\n"
             for method, result in self.outlier_results['Multivariate'].items():
+                if not isinstance(result, dict) or 'outlier_count' not in result:
                     continue
                 report += f"**{method}:**\n"
+                report += f"- Outliers found: {result['outlier_count']} ({result['outlier_percentage']:.2f}%)\n"
+                report += f"- Explanation: {result['explanation']}\n\n"
+        return report