Spaces:

Jayesh13
/

Protein_repeat_comparator

Sleeping

App Files Files Community

Jayesh13 commited on Apr 12

Commit

5a2a00f

verified ·

1 Parent(s): 2c0f1ac

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -8

app.py CHANGED Viewed

@@ -14,18 +14,15 @@ uploaded_file2 = st.file_uploader("Upload Second Excel File", type=["xlsx"])
 if uploaded_file1 and uploaded_file2:
     try:
-        # Read files: header is in the first row (index 0)
         df1 = pd.read_excel(uploaded_file1, header=0)
         df2 = pd.read_excel(uploaded_file2, header=0)
-        # Ensure column names are strings
         df1.columns = df1.columns.astype(str)
         df2.columns = df2.columns.astype(str)
-        # Get ID and Name columns
         id_col = df1.columns[0]
         name_col = df1.columns[1]
-        repeat_columns = df1.columns[2:]  # Repeat columns start from index 2
         differences = []
@@ -43,34 +40,46 @@ if uploaded_file1 and uploaded_file2:
                 freq1 = row1[repeat_col]
                 freq2 = row2[repeat_col]
-                if pd.isna(freq1) or pd.isna(freq2):
                     continue
                 if freq1 != freq2:
                     diff = abs(freq1 - freq2)
                     differences.append({
                         id_col: entry_id,
                         name_col: protein_name,
                         "Repeat": repeat_col,
                         "Frequency File 1": freq1,
                         "Frequency File 2": freq2,
-                        "Difference": diff
                     })
         if differences:
             result_df = pd.DataFrame(differences)
             result_df = result_df.sort_values(by="Difference", ascending=False)
             output = BytesIO()
             with pd.ExcelWriter(output, engine='openpyxl') as writer:
-                result_df.to_excel(writer, index=False)
             output.seek(0)
             st.success("✅ Comparison complete. Showing only changed repeats.")
             st.download_button(
                 label="📥 Download Excel",
                 data=output,
-                file_name="changed_repeats.xlsx",
                 mime="application/vnd.openxmlformats-officedocument.spreadsheetml.sheet"
             )
         else:

 if uploaded_file1 and uploaded_file2:
     try:
         df1 = pd.read_excel(uploaded_file1, header=0)
         df2 = pd.read_excel(uploaded_file2, header=0)
         df1.columns = df1.columns.astype(str)
         df2.columns = df2.columns.astype(str)
         id_col = df1.columns[0]
         name_col = df1.columns[1]
+        repeat_columns = df1.columns[2:]
         differences = []
                 freq1 = row1[repeat_col]
                 freq2 = row2[repeat_col]
+                if pd.isna(freq1) or pd.isna(freq2) or freq1 == 0:
                     continue
                 if freq1 != freq2:
                     diff = abs(freq1 - freq2)
+                    pct_change = ((freq2 - freq1) / freq1) * 100
                     differences.append({
                         id_col: entry_id,
                         name_col: protein_name,
                         "Repeat": repeat_col,
                         "Frequency File 1": freq1,
                         "Frequency File 2": freq2,
+                        "Difference": diff,
+                        "%age Change": pct_change
                     })
         if differences:
             result_df = pd.DataFrame(differences)
             result_df = result_df.sort_values(by="Difference", ascending=False)
+            # Style for Excel (green for +, red for -)
+            def color_pct(val):
+                if val > 0:
+                    return 'color: green'
+                elif val < 0:
+                    return 'color: red'
+                return ''
+            styled_df = result_df.style.applymap(color_pct, subset=["%age Change"])
             output = BytesIO()
             with pd.ExcelWriter(output, engine='openpyxl') as writer:
+                styled_df.to_excel(writer, index=False, sheet_name="Changed Repeats")
             output.seek(0)
             st.success("✅ Comparison complete. Showing only changed repeats.")
             st.download_button(
                 label="📥 Download Excel",
                 data=output,
+                file_name="changed_repeats_with_percentage.xlsx",
                 mime="application/vnd.openxmlformats-officedocument.spreadsheetml.sheet"
             )
         else: