Spaces:

Chamin09
/

BrailleMenuGenV2

Running

App Files Files Community

Chamin09 commited on May 8

Commit

97648fc

verified ·

1 Parent(s): bf28af1

Update app.py

Browse files

Files changed (1) hide show

app.py +58 -0

app.py CHANGED Viewed

@@ -47,6 +47,64 @@ def process_image(image, use_llm, use_context):
     # Preprocess the image
     preprocessed_img = preprocess_image(image)
     # Extract text using document AI
     try:
         result = extract_text_and_layout(preprocessed_img)

     # Preprocess the image
     preprocessed_img = preprocess_image(image)
+    # Extract text using document AI
+    try:
+        result = extract_text_and_layout(preprocessed_img)
+        if not result.get('words', []):
+            return "No text was extracted from the image.", "", "", None
+        raw_text = ' '.join(result['words'])
+        # Process text with LLM if enabled
+        if use_llm:
+            processed_result = process_menu_text(raw_text)
+            if processed_result['success']:
+                processed_text = processed_result['structured_text']
+            else:
+                processed_text = raw_text
+        else:
+            processed_text = raw_text
+        # Translate to Braille
+        braille_result = text_to_braille(processed_text, use_context=use_context)
+        if not braille_result['success']:
+            return processed_text, "", "Braille translation failed.", None
+        braille_text = braille_result['formatted_braille']
+        # Generate metadata
+        metadata = get_braille_metadata(processed_text)
+        metadata_text = f"Translation contains {metadata['word_count']} words, {metadata['character_count']} characters, {metadata['line_count']} lines."
+        # Store both Unicode and ASCII versions for later use
+        state_data = {
+            'original_text': processed_text,
+            'braille_text': braille_text,
+            'ascii_braille': braille_result.get('formatted_ascii', '')
+        }
+        # Return results
+        return processed_text, braille_text, metadata_text, state_data
+    except Exception as e:
+        return f"Error processing image: {str(e)}", "", "", None
+def process_image1(image, use_llm, use_context):
+    """Process the uploaded image and generate results."""
+    if image is None:
+        return "Please upload an image first.", "", "", None
+    # Convert to PIL Image if needed
+    if isinstance(image, np.ndarray):
+        image = Image.fromarray(image)
+    # Preprocess the image
+    preprocessed_img = preprocess_image(image)
     # Extract text using document AI
     try:
         result = extract_text_and_layout(preprocessed_img)