Spaces:
Runtime error
Runtime error
A newer version of the Gradio SDK is available:
5.44.0
metadata
title: DittoTalkingHead
emoji: 🗣️
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.19.0
app_file: app.py
pinned: false
license: apache-2.0
hardware: a100-large
preload_from_hub:
- digital-avatar/ditto-talkinghead
DittoTalkingHead - Talking Head Generation
音声とソース画像から、リアルなTalking Headビデオを生成します。
特徴
- 高品質なリップシンク
- 自然な表情と頭部の動き
- TensorRTによる高速推論
- 自動モデルダウンロード機能
使い方
- 音声ファイル(WAV形式)をアップロード
- ソース画像(PNG/JPG形式)をアップロード
- 生成ボタンをクリック
技術仕様
- GPU: NVIDIA A100(推奨)
- フレームワーク: PyTorch
- モデル: DittoTalkingHead (PyTorch版)
- モデルサイズ: 約2.5GB
注意事項
- 初回実行時は、モデルの自動ダウンロードのため時間がかかります(約10-15分)
- GPU(A100)環境での実行を推奨します
- 音声ファイルは16kHz WAV形式が推奨です
モデルソース
モデルはdigital-avatar/ditto-talkingheadから自動的にダウンロードされます。
ライセンス
Apache License 2.0