talkingAvater_bgk / README_hf_space.md
oKen38461's picture
Phase1クリア
8768811

A newer version of the Gradio SDK is available: 5.44.0

Upgrade
metadata
title: DittoTalkingHead
emoji: 🗣️
colorFrom: blue
colorTo: purple
sdk: gradio
sdk_version: 4.19.0
app_file: app.py
pinned: false
license: apache-2.0
hardware: a100-large
preload_from_hub:
  - digital-avatar/ditto-talkinghead

DittoTalkingHead - Talking Head Generation

音声とソース画像から、リアルなTalking Headビデオを生成します。

特徴

  • 高品質なリップシンク
  • 自然な表情と頭部の動き
  • TensorRTによる高速推論
  • 自動モデルダウンロード機能

使い方

  1. 音声ファイル(WAV形式)をアップロード
  2. ソース画像(PNG/JPG形式)をアップロード
  3. 生成ボタンをクリック

技術仕様

  • GPU: NVIDIA A100(推奨)
  • フレームワーク: PyTorch
  • モデル: DittoTalkingHead (PyTorch版)
  • モデルサイズ: 約2.5GB

注意事項

  • 初回実行時は、モデルの自動ダウンロードのため時間がかかります(約10-15分)
  • GPU(A100)環境での実行を推奨します
  • 音声ファイルは16kHz WAV形式が推奨です

モデルソース

モデルはdigital-avatar/ditto-talkingheadから自動的にダウンロードされます。

ライセンス

Apache License 2.0