A newer version of the Gradio SDK is available:
5.42.0
κ°μκΈ° μ ν [[accelerator-selection]]
λΆμ° νμ΅ μ€μλ μ¬μ©ν κ°μκΈ°(CUDA, XPU, MPS, HPU λ±)μ μμ μμλ₯Ό μ§μ ν μ μμ΅λλ€. μ΄λ μλ‘ λ€λ₯Έ μ»΄ν¨ν μ±λ₯μ κ°μ§ κ°μκΈ°κ° μμ λ λ λΉ λ₯Έ κ°μκΈ°λ₯Ό λ¨Όμ μ¬μ©νκ³ μΆμ κ²½μ°μ μ μ©ν μ μμ΅λλ€. λλ μ¬μ© κ°λ₯ν κ°μκΈ°μ μΌλΆλ§ μ¬μ©ν μλ μμ΅λλ€. μ ν κ³Όμ μ DistributedDataParallelκ³Ό DataParallel λͺ¨λμμ μλν©λλ€. Accelerateλ DeepSpeed integrationλ νμνμ§ μμ΅λλ€.
μ΄ κ°μ΄λλ μ¬μ©ν κ°μκΈ°μ μμ μ¬μ© μμλ₯Ό μ ννλ λ°©λ²μ 보μ¬μ€λλ€.
κ°μκΈ° μ [[number-of-accelerators]]
μλ₯Ό λ€μ΄, 4κ°μ κ°μκΈ°κ° μκ³ μ²μ 2κ°λ§ μ¬μ©νκ³ μΆλ€λ©΄ μλ λͺ λ Ήμ μ€ννμΈμ.
--nproc_per_node
λ₯Ό μ¬μ©νμ¬ μ¬μ©ν κ°μκΈ° μλ₯Ό μ νν©λλ€.
torchrun --nproc_per_node=2 trainer-program.py ...
--num_processes
λ₯Ό μ¬μ©νμ¬ μ¬μ©ν κ°μκΈ° μλ₯Ό μ νν©λλ€.
accelerate launch --num_processes 2 trainer-program.py ...
--num_gpus
λ₯Ό μ¬μ©νμ¬ μ¬μ©ν GPU μλ₯Ό μ νν©λλ€.
deepspeed --num_gpus 2 trainer-program.py ...
κ°μκΈ° μμ [[order-of-accelerators]]
μ¬μ©ν νΉμ κ°μκΈ°μ κ·Έ μμλ₯Ό μ ννλ €λ©΄ νλμ¨μ΄μ μ ν©ν νκ²½ λ³μλ₯Ό μ¬μ©νμΈμ. μ΄λ μ’
μ’
κ° μ€νμ λν΄ λͺ
λ Ήμ€μμ μ€μ λμ§λ§, ~/.bashrc
λ λ€λ₯Έ μμ κ΅¬μ± νμΌμ μΆκ°ν μλ μμ΅λλ€.
μλ₯Ό λ€μ΄, 4κ°μ κ°μκΈ°(0, 1, 2, 3)κ° μκ³ κ°μκΈ° 0κ³Ό 2λ§ μ€ννκ³ μΆλ€λ©΄:
CUDA_VISIBLE_DEVICES=0,2 torchrun trainer-program.py ...
GPU 0κ³Ό 2λ§ PyTorchμμ "보μ΄λ©°" κ°κ° cuda:0
κ³Ό cuda:1
λ‘ λ§€νλ©λλ€.
μμλ₯Ό λ°κΎΈλ €λ©΄ (GPU 2λ₯Ό cuda:0
μΌλ‘, GPU 0μ cuda:1
λ‘ μ¬μ©):
CUDA_VISIBLE_DEVICES=2,0 torchrun trainer-program.py ...
GPU μμ΄ μ€ννλ €λ©΄:
CUDA_VISIBLE_DEVICES= python trainer-program.py ...
CUDA_DEVICE_ORDER
λ₯Ό μ¬μ©νμ¬ CUDA μ₯μΉμ μμλ₯Ό μ μ΄ν μλ μμ΅λλ€:
PCIe λ²μ€ ID μμ (
nvidia-smi
μ μΌμΉ):
$hf_i18n_placeholder21export CUDA_DEVICE_ORDER=PCI_BUS_ID ```
μ»΄ν¨ν μ±λ₯ μμ (κ°μ₯ λΉ λ₯Έ κ²λΆν°):
export CUDA_DEVICE_ORDER=FASTEST_FIRST
ZE_AFFINITY_MASK=0,2 torchrun trainer-program.py ...
XPU 0κ³Ό 2λ§ PyTorchμμ "보μ΄λ©°" κ°κ° xpu:0
κ³Ό xpu:1
λ‘ λ§€νλ©λλ€.
μμλ₯Ό λ°κΎΈλ €λ©΄ (XPU 2λ₯Ό xpu:0
μΌλ‘, XPU 0μ xpu:1
λ‘ μ¬μ©):
ZE_AFFINITY_MASK=2,0 torchrun trainer-program.py ...
λ€μμ μ¬μ©νμ¬ Intel XPUμ μμλ₯Ό μ μ΄ν μλ μμ΅λλ€:
export ZE_ENABLE_PCI_ID_DEVICE_ORDER=1
Intel XPUμμμ μ₯μΉ μ΄κ±° λ° μ λ ¬μ λν μμΈν μ 보λ Level Zero λ¬Έμλ₯Ό μ°Έμ‘°νμΈμ.
νκ²½ λ³μλ λͺ λ Ήμ€μ μΆκ°νλ λμ λ΄λ³΄λΌ μ μμ΅λλ€. νκ²½ λ³μκ° μ΄λ»κ² μ€μ λμλμ§ μμ΄λ²λ¦¬κ³ μλͺ»λ κ°μκΈ°λ₯Ό μ¬μ©νκ² λ μ μμ΄ νΌλμ μΌκΈ°ν μ μμΌλ―λ‘ κΆμ₯νμ§ μμ΅λλ€. λμ , κ°μ λͺ λ Ήμ€μμ νΉμ νλ ¨ μ€νμ μν΄ νκ²½ λ³μλ₯Ό μ€μ νλ κ²μ΄ μΌλ°μ μΈ κ΄λ‘μ λλ€. ```