Dokdo-multimodal

Paused

App Files Files Community

aiqcamp commited on Dec 22, 2024

Commit

6251d81

verified ·

1 Parent(s): f6c9d00

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -16

app.py CHANGED Viewed

@@ -3,52 +3,54 @@ import logging
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
-# 2. 나머지 imports
 import os
 import time
 from datetime import datetime
 import gradio as gr
-# GPU 초기화 설정
 import torch
-if torch.cuda.is_available():
-    torch.cuda.init()
-    device = torch.device('cuda')
-    logger.info(f"Using GPU: {torch.cuda.get_device_name(0)}")
-else:
-    device = torch.device('cpu')
-    logger.warning("GPU not available, using CPU")
 import requests
 from pathlib import Path
 import cv2
 from PIL import Image
 import json
-import spaces
 import torchaudio
 import tempfile
 try:
     import mmaudio
 except ImportError:
     os.system("pip install -e .")
     import mmaudio
 from mmaudio.eval_utils import (ModelConfig, all_model_cfg, generate, load_video, make_video,
                                 setup_eval_logging)
 from mmaudio.model.flow_matching import FlowMatching
 from mmaudio.model.networks import MMAudio, get_my_mmaudio
 from mmaudio.model.sequence_config import SequenceConfig
 from mmaudio.model.utils.features_utils import FeaturesUtils
-# 상단에 번역 모델 import 추가
 from transformers import pipeline
 translator = pipeline("translation", model="Helsinki-NLP/opus-mt-ko-en")
-# 3. API 설정
 CATBOX_USER_HASH = "30f52c895fd9d9cb387eee489"
 REPLICATE_API_TOKEN = os.getenv("API_KEY")
-# 4. 오디오 모델 설정
 dtype = torch.bfloat16 if torch.cuda.is_available() else torch.float32
 # 5. get_model 함수 정의

 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
+# 2. spaces를 먼저 import
+import spaces
+# 3. 나머지 imports
 import os
 import time
 from datetime import datetime
 import gradio as gr
 import torch
 import requests
 from pathlib import Path
 import cv2
 from PIL import Image
 import json
 import torchaudio
 import tempfile
+# 4. GPU 초기화 설정
+if torch.cuda.is_available():
+    device = torch.device('cuda')
+    logger.info(f"Using GPU: {torch.cuda.get_device_name(0)}")
+else:
+    device = torch.device('cpu')
+    logger.warning("GPU not available, using CPU")
 try:
     import mmaudio
 except ImportError:
     os.system("pip install -e .")
     import mmaudio
+# 나머지 imports
 from mmaudio.eval_utils import (ModelConfig, all_model_cfg, generate, load_video, make_video,
                                 setup_eval_logging)
 from mmaudio.model.flow_matching import FlowMatching
 from mmaudio.model.networks import MMAudio, get_my_mmaudio
 from mmaudio.model.sequence_config import SequenceConfig
 from mmaudio.model.utils.features_utils import FeaturesUtils
+# 번역 모델 import
 from transformers import pipeline
 translator = pipeline("translation", model="Helsinki-NLP/opus-mt-ko-en")
+# API 설정
 CATBOX_USER_HASH = "30f52c895fd9d9cb387eee489"
 REPLICATE_API_TOKEN = os.getenv("API_KEY")
+# 오디오 모델 설정
 dtype = torch.bfloat16 if torch.cuda.is_available() else torch.float32
 # 5. get_model 함수 정의