Spaces:

roll-ai
/

Flov-space

Paused

App Files Files Community

roll-ai commited on 9 days ago

Commit

bc8f7b7

verified ·

1 Parent(s): 828b5b4

Update app.py

Browse files

Files changed (1) hide show

app.py +21 -8

app.py CHANGED Viewed

@@ -1,13 +1,19 @@
 import gradio as gr
 import os
 import torch
 from PIL import Image
 from inference.flovd_demo import generate_video
-import requests
-import shutil
 from huggingface_hub import snapshot_download
 # Get the HF token from environment variable
 hf_token = os.getenv("HF_TOKEN")
@@ -17,11 +23,12 @@ snapshot_download(
     repo_type="dataset",
     local_dir="./ckpt",
     allow_patterns="ckpt/**",
     token=hf_token
 )
-# ✅ Print the directory tree of ./ckpt
-print("📂 Contents of ./ckpt directory:")
 for root, dirs, files in os.walk("./ckpt"):
     level = root.replace("./ckpt", "").count(os.sep)
     indent = " " * 4 * level
@@ -32,7 +39,6 @@ for root, dirs, files in os.walk("./ckpt"):
 # --------- UI Function ---------
 def run_flovd(prompt, image, cam_pose_name):
-    download_if_missing()
     image_path = "./temp_input.png"
     image.save(image_path)
@@ -42,10 +48,16 @@ def run_flovd(prompt, image, cam_pose_name):
         omsm_path=OMSM_PATH,
         image_path=image_path,
         cam_pose_name=cam_pose_name,
-        output_path="./output/",
         dtype=torch.float16,
     )
-    return "./output/generated_videos/your_video.mp4"
 # --------- Launch Gradio ---------
 iface = gr.Interface(
@@ -58,4 +70,5 @@ iface = gr.Interface(
     outputs=gr.Video(label="Generated Video"),
     title="FloVD - Optical Flow Video Diffusion with Camera Motion",
 )
 iface.launch(server_name="0.0.0.0", server_port=7860)

 import gradio as gr
 import os
 import torch
 from PIL import Image
 from inference.flovd_demo import generate_video
 from huggingface_hub import snapshot_download
+# Constants
+FVSM_PATH = "./ckpt/FVSM/FloVD_FVSM_Controlnet.pt"
+OMSM_PATH = "./ckpt/OMSM/"
+DEPTH_CKPT_PATH = "./ckpt/others/depth_anything_v2_metric_hypersim_vitb.pth"
+OUTPUT_PATH = "./results/"
+POSE_TYPE = "re10k"
+CONTROLNET_GUIDANCE_END = 0.4
+SPEED = 1.0
 # Get the HF token from environment variable
 hf_token = os.getenv("HF_TOKEN")
     repo_type="dataset",
     local_dir="./ckpt",
     allow_patterns="ckpt/**",
+    cache_dir="./hf_cache",  # avoid permission issues
     token=hf_token
 )
+# Print the directory structure of ckpt
+print("\n📂 Contents of ./ckpt directory:")
 for root, dirs, files in os.walk("./ckpt"):
     level = root.replace("./ckpt", "").count(os.sep)
     indent = " " * 4 * level
 # --------- UI Function ---------
 def run_flovd(prompt, image, cam_pose_name):
     image_path = "./temp_input.png"
     image.save(image_path)
         omsm_path=OMSM_PATH,
         image_path=image_path,
         cam_pose_name=cam_pose_name,
+        output_path=OUTPUT_PATH,
+        controlnet_guidance_end=CONTROLNET_GUIDANCE_END,
+        pose_type=POSE_TYPE,
+        speed=SPEED,
+        depth_ckpt_path=DEPTH_CKPT_PATH,
         dtype=torch.float16,
+        use_flow_integration=True,
     )
+    return "./results/generated_videos/your_video.mp4"
 # --------- Launch Gradio ---------
 iface = gr.Interface(
     outputs=gr.Video(label="Generated Video"),
     title="FloVD - Optical Flow Video Diffusion with Camera Motion",
 )
 iface.launch(server_name="0.0.0.0", server_port=7860)