Spaces:

flax-community
/

koclip

Build error

App Files Files Community

Trent commited on Jul 18, 2021

Commit

8e37dd1

1 Parent(s): c6d1483

Embed.py implementation

Browse files

Files changed (2) hide show

embed.py +26 -25
requirements.txt +1 -0

embed.py CHANGED Viewed

@@ -5,33 +5,41 @@ import os
 from PIL import Image
 from utils import load_model
 def main(args):
     root = args.image_path
     files = list(os.listdir(root))
-    for model_name in ["koclip", "koclip/koclip-large"]:
-        counter = 0
-        images = []
-        image_ids = []
         model, processor = load_model(f"koclip/{model_name}")
-        while counter < len(files):
-            if counter != 0 and counter % args.batch_size == 0:
-                inputs = processor(text=[""], images=images, return_tensors="jax", padding=True)
                 features = model(**inputs).image_embeds
-                with open(os.path.join(args.out_path, f"{model_name}.tsv", "w+")) as f:
                     writer = csv.writer(f, delimiter="\t")
                     for image_id, feature in zip(image_ids, features):
-                        writer.writerow([image_id, ",".join(feature)])
-                images = []
-                image_ids = []
-            else:
-                file_ = files[counter]
-                image = Image.open(os.path.join(root, file_))
-                images.append(image)
-                image_ids.append(file_)
-                counter += 1
 if __name__ == "__main__":
@@ -41,10 +49,3 @@ if __name__ == "__main__":
     parser.add_argument("--out_path", default="features")
     args = parser.parse_args()
     main(args)

 from PIL import Image
 from utils import load_model
+import jax.numpy as jnp
+from jax import jit
+from tqdm import tqdm
 def main(args):
     root = args.image_path
     files = list(os.listdir(root))
+    for f in files:
+        assert(f[-4:] == ".jpg")
+    for model_name in ["koclip", "koclip-large"]:
         model, processor = load_model(f"koclip/{model_name}")
+        with tqdm(total=len(files)) as pbar:
+            for counter in range(0, len(files), args.batch_size):
+                images = []
+                image_ids = []
+                for idx in range(counter, min(len(files), counter + args.batch_size)):
+                    file_ = files[idx]
+                    image = Image.open(os.path.join(root, file_)).convert('RGB')
+                    images.append(image)
+                    image_ids.append(file_)
+                pbar.update(args.batch_size)
+                try:
+                    inputs = processor(text=[""], images=images, return_tensors="jax", padding=True)
+                except:
+                    print(image_ids)
+                    break
+                inputs['pixel_values'] = jnp.transpose(inputs['pixel_values'], axes=[0, 2, 3, 1])
                 features = model(**inputs).image_embeds
+                with open(os.path.join(args.out_path, f"{model_name}.tsv"), "a+") as f:
                     writer = csv.writer(f, delimiter="\t")
                     for image_id, feature in zip(image_ids, features):
+                        writer.writerow([image_id, ",".join(map(lambda x: str(x), feature))])
 if __name__ == "__main__":
     parser.add_argument("--out_path", default="features")
     args = parser.parse_args()
     main(args)

requirements.txt CHANGED Viewed

@@ -3,3 +3,4 @@ jaxlib
 flax
 transformers
 streamlit

 flax
 transformers
 streamlit
+tqdm