Spaces:

irotem98
/

edge_vlm

Runtime error

App Files Files Community

irotem98 commited on Sep 14, 2024

Commit

d297ae6

verified ·

1 Parent(s): ffcc661

Update app.py

Browse files

Files changed (1) hide show

app.py +23 -9

app.py CHANGED Viewed

@@ -1,11 +1,18 @@
 import os
 import shutil
 import subprocess
 subprocess.run(["git", "clone", "https://huggingface.co/irotem98/edge_vlm"])
 subprocess.run(["pip", "install", "-r", "edge_vlm/requirements.txt"])
 subprocess.run(["pip", "install", "sentencepiece"])
 source_dir = "edge_vlm"
 destination_dir = "."
@@ -13,44 +20,51 @@ for item in os.listdir(source_dir):
     source_item = os.path.join(source_dir, item)
     destination_item = os.path.join(destination_dir, item)
-    # If it's a directory, copy it recursively
     if os.path.isdir(source_item):
         if os.path.exists(destination_item):
-            shutil.rmtree(destination_item)  # Remove if it already exists
         shutil.copytree(source_item, destination_item)
     else:
-        # If it's a file, copy it
         shutil.copy(source_item, destination_item)
 # Now import the model from the copied files
 from model import MoondreamModel
-import torch
-import gradio as gr
 # Load the model and tokenizer
 model = MoondreamModel.load_model()
 tokenizer = MoondreamModel.load_tokenizer()
 # Define the default question
 default_question = "Describe the image."
 # Function to handle image and return generated caption
 def generate_caption_with_default(image):
-    # Preprocess the image
     preprocessed_image = MoondreamModel.preprocess_image(image)
-    # Generate caption
     caption = MoondreamModel.generate_caption(model, preprocessed_image, tokenizer)
     return caption
 interface = gr.Interface(
     fn=generate_caption_with_default,
-    inputs=gr.Image(type="pil", label="Upload an Image"),  # Updated input
     outputs="text",
     title="Image Caption Generator",
     description=f"The default question is: '{default_question}'. Upload an image to generate a description."
 )
 # Launch the interface
-interface.launch()

 import os
 import shutil
 import subprocess
+import torch
+import gradio as gr
+# Clone and install dependencies
+print("Cloning the repository...")
 subprocess.run(["git", "clone", "https://huggingface.co/irotem98/edge_vlm"])
+print("Installing dependencies...")
 subprocess.run(["pip", "install", "-r", "edge_vlm/requirements.txt"])
 subprocess.run(["pip", "install", "sentencepiece"])
+# Copy all files from edge_vlm to current directory
+print("Copying files...")
 source_dir = "edge_vlm"
 destination_dir = "."
     source_item = os.path.join(source_dir, item)
     destination_item = os.path.join(destination_dir, item)
     if os.path.isdir(source_item):
         if os.path.exists(destination_item):
+            shutil.rmtree(destination_item)
         shutil.copytree(source_item, destination_item)
     else:
         shutil.copy(source_item, destination_item)
+print("Files copied successfully.")
 # Now import the model from the copied files
 from model import MoondreamModel
 # Load the model and tokenizer
+print("Loading model...")
 model = MoondreamModel.load_model()
+print("Model loaded.")
+print("Loading tokenizer...")
 tokenizer = MoondreamModel.load_tokenizer()
+print("Tokenizer loaded.")
 # Define the default question
 default_question = "Describe the image."
 # Function to handle image and return generated caption
 def generate_caption_with_default(image):
+    print("Preprocessing image...")
     preprocessed_image = MoondreamModel.preprocess_image(image)
+    print("Image preprocessed.")
+    print("Generating caption...")
     caption = MoondreamModel.generate_caption(model, preprocessed_image, tokenizer)
+    print("Caption generated.")
     return caption
+# Create Gradio interface
+print("Setting up Gradio interface...")
 interface = gr.Interface(
     fn=generate_caption_with_default,
+    inputs=gr.Image(type="pil", label="Upload an Image"),
     outputs="text",
     title="Image Caption Generator",
     description=f"The default question is: '{default_question}'. Upload an image to generate a description."
 )
 # Launch the interface
+print("Launching interface...")
+interface.launch()