Spaces:

bvd757
/

checked

Sleeping

App Files Files Community

bvd757 commited on May 10

Commit

d474752

1 Parent(s): 3d0e128

highlight mode

Browse files

Files changed (2) hide show

app.py +1 -1
search_errors_logic.py +45 -6

app.py CHANGED Viewed

@@ -136,7 +136,7 @@ def main():
         if not text.strip():
             st.warning("Введите текст для проверки")
         else:
-            text, errors = check_text(text, tool, mode="chat_gpt")
             if not errors:
                 st.success("Ошибок не найдено.")
             else:

         if not text.strip():
             st.warning("Введите текст для проверки")
         else:
+            text, errors = check_text(text, tool, mode="chat_gpt", highlight_mode=True)
             if not errors:
                 st.success("Ошибок не найдено.")
             else:

search_errors_logic.py CHANGED Viewed

@@ -51,7 +51,7 @@ corrected text:
 "я решил пойти в"
 Твой ответ:
-Опечатка: повтор пробла.
 Теперь твоя очередь:
@@ -183,11 +183,14 @@ def add_comments_to_text(text, errors, add_errors=False):
     return text.replace("\n", " ")
-def check_text(text, tool, mode="chat_gpt", add_errors=False):
     if mode == "tool":
         return check_text_with_tool(text, tool, add_errors=add_errors)
     else:
-        return check_text_chat_gpt(text, add_errors=add_errors)
 def check_text_chat_gpt(text, fixed_text=None, add_errors=False, *args, **kwargs):
@@ -196,12 +199,48 @@ def check_text_chat_gpt(text, fixed_text=None, add_errors=False, *args, **kwargs
     changes = find_corrected_positions(text, fixed_text)
     errors = []
     for change in changes:
-        start_orig, end_orid = get_piece_of_text_bounds(text, change['original'][0], change['original'][1])
         start_corr, end_corr = get_piece_of_text_bounds(fixed_text, change['corrected'][0], change['corrected'][1])
-        inp = prompt_compare_get_comment.format(text[start_orig:end_orid], fixed_text[start_corr:end_corr])
         errors.append({
             'start': start_orig,
-            'end': end_orid,
             'message': get_gpt_response(inp, client_name="vsegpt"),
         })

 "я решил пойти в"
 Твой ответ:
+Опечатка: повтор пробела.
 Теперь твоя очередь:
     return text.replace("\n", " ")
+def check_text(text, tool, mode="chat_gpt", highlight_mode=False, add_errors=False):
     if mode == "tool":
         return check_text_with_tool(text, tool, add_errors=add_errors)
     else:
+        if highlight_mode:
+            return check_text_chat_gpt_highlight_mode(text, add_errors=add_errors)
+        else:
+            return check_text_chat_gpt(text, add_errors=add_errors)
 def check_text_chat_gpt(text, fixed_text=None, add_errors=False, *args, **kwargs):
     changes = find_corrected_positions(text, fixed_text)
     errors = []
     for change in changes:
+        start_orig, end_orig = get_piece_of_text_bounds(text, change['original'][0], change['original'][1])
         start_corr, end_corr = get_piece_of_text_bounds(fixed_text, change['corrected'][0], change['corrected'][1])
+        inp = prompt_compare_get_comment.format(text[start_orig:end_orig], fixed_text[start_corr:end_corr])
         errors.append({
             'start': start_orig,
+            'end': end_orig,
+            'message': get_gpt_response(inp, client_name="vsegpt"),
+        })
+    text_with_comments = add_comments_to_text(text, errors, add_errors=add_errors)
+    return text_with_comments, errors
+def check_text_chat_gpt_highlight_mode(text, fixed_text=None, add_errors=False, *args, **kwargs):
+    if fixed_text is None:
+        fixed_text = get_gpt_response(prompt_fix_text_gpt.format(text), "vsegpt")
+    changes = find_corrected_positions(text, fixed_text)
+    bounds_init = []
+    for change in changes:
+        start_orig, end_orig = get_piece_of_text_bounds(text, change['original'][0], change['original'][1])
+        start_corr, end_corr = get_piece_of_text_bounds(fixed_text, change['corrected'][0], change['corrected'][1])
+        bounds_init.append({"start_orig": start_orig,
+                        "end_orig": end_orig,
+                        "start_corr": start_corr,
+                        "end_corr": end_corr})
+    bounds_init = sorted(bounds_init, key=lambda x: x["start_orig"])
+    bounds_result = [bounds_init[0]] if len(bounds_init) > 0 else []
+    for bound in bounds_init[1:]:
+        if bounds_result[-1]["end_orig"] >= bound["start_orig"]:
+            bounds_result[-1]["end_orig"] = max(bounds_result[-1]["end_orig"], bound["end_orig"])
+            bounds_result[-1]["end_corr"] = max(bounds_result[-1]["end_corr"], bound["end_corr"])
+        else:
+            bounds_result.append(bound.copy())
+    errors = []
+    for bound in bounds_result:
+        inp = prompt_compare_get_comment.format(text[bound["start_orig"]:bound["end_orig"]],
+                                                fixed_text[bound["start_corr"]:bound["end_corr"]])
+        errors.append({
+            'start': start_orig,
+            'end': end_orig,
             'message': get_gpt_response(inp, client_name="vsegpt"),
         })