ocr-3

Runtime error

Zienab commited on Nov 24, 2024

Commit

9ea0c0e

verified ·

1 Parent(s): 71c8ab5

Update app/utils.py

Files changed (1) hide show

app/utils.py CHANGED Viewed

@@ -1,6 +1,7 @@
 from transformers import AutoModel, AutoTokenizer
 import os
 import torch
 class OCRModel:
     _instance = None
@@ -12,30 +13,32 @@ class OCRModel:
         return cls._instance
     def initialize(self):
-        # تحميل النموذج مرة واحدة وتخزينه محلياً
         model_path = os.getenv('MODEL_PATH', 'RufusRubin777/GOT-OCR2_0_CPU')
         self.tokenizer = AutoTokenizer.from_pretrained(
             model_path,
             trust_remote_code=True,
-            local_files_only=False  # سيتم تحميل الملفات إذا لم تكن موجودة
         )
         self.model = AutoModel.from_pretrained(
             model_path,
             trust_remote_code=True,
             low_cpu_mem_usage=True,
-            device_map='cpu',  # سيختار أفضل جهاز متاح
             use_safetensors=True,
             pad_token_id=self.tokenizer.eos_token_id
         )
         self.model = self.model.eval()
-    def process_image(self, image_path):
         try:
-            with torch.no_grad():  # تحسين الأداء وتقليل استهلاك الذاكرة
-                result = self.model.chat(self.tokenizer, image_path, ocr_type='format')
             return result
         except Exception as e:
             return f"Error processing image: {str(e)}"

 from transformers import AutoModel, AutoTokenizer
 import os
 import torch
+from PIL import Image
 class OCRModel:
     _instance = None
         return cls._instance
     def initialize(self):
         model_path = os.getenv('MODEL_PATH', 'RufusRubin777/GOT-OCR2_0_CPU')
         self.tokenizer = AutoTokenizer.from_pretrained(
             model_path,
             trust_remote_code=True,
+            local_files_only=False
         )
         self.model = AutoModel.from_pretrained(
             model_path,
             trust_remote_code=True,
             low_cpu_mem_usage=True,
+            device_map='cpu',
             use_safetensors=True,
             pad_token_id=self.tokenizer.eos_token_id
         )
         self.model = self.model.eval()
+    def process_image(self, image_stream):
         try:
+            # فتح الصورة من الذاكرة
+            image = Image.open(image_stream)
+            with torch.no_grad():
+                result = self.model.chat(self.tokenizer, image, ocr_type='format')
             return result
         except Exception as e:
             return f"Error processing image: {str(e)}"