Spaces:

adilkh26
/

InternVideo2_5_Chat_8B

Build error

adilkh26 commited on Mar 2

Commit

b8969f6

verified ·

1 Parent(s): 8cf71ba

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import gradio as gr
 import torch
-from transformers import AutoModel, AutoTokenizer
 import deepspeed
 # Model name
@@ -10,12 +10,12 @@ model_name = "OpenGVLab/InternVideo2_5_Chat_8B"
 tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
 # Load model efficiently
-model = AutoModel.from_pretrained(
     model_name,
     trust_remote_code=True,
     torch_dtype=torch.float16,  # Use float16 for lower memory usage
     device_map="auto", # Automatically place model on available GPU
-    deepspeed={"stage": 3}
 )
 # Define inference function

 import gradio as gr
 import torch
+from transformers import AutoModel, AutoTokenizer, AutoModelForCasualLM
 import deepspeed
 # Model name
 tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
 # Load model efficiently
+model = AutoModelForCasualLM.from_pretrained(
     model_name,
     trust_remote_code=True,
     torch_dtype=torch.float16,  # Use float16 for lower memory usage
     device_map="auto", # Automatically place model on available GPU
 )
 # Define inference function