概要
Stable Video Diffusion (SVD) は、Stability AI 社が開発したテキストや画像から動画を生成する拡散モデルです。
ここでは ローカル PC 上の、より新しいモデルである Stable Video Diffusion (SVD) 1.1 の環境を用意して使ってみたので情報残しておきます。
git などを直接使わずに、Stability Matrix を使って簡単に実行環境を用意できました。
NVIDIA GeForce RTX 5060Ti 16GB で SVD 1.1 がどこまで動くのか の一助になれば幸いです。

公式サイト
https://ja.stability.ai/video
モデル配布(Hugging Face)
SVD
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid
SVD-XT
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt
SVD 1.1
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1
ライセンスなど
公式ページの記載は以下です。
Stable Video ライセンス
Stable Video Diffusionを使用する前に、ライセンスを確認してください。
Stability AIは、Stable Video Diffusionを、研究およびその他の非商業的な目的のために、モデルコードおよび重みを含めて、自由に利用できるようにしています。Stable Video Diffusionの使用には、Stability AI Acceptable Use Policyに記載されている使用およびコンテンツの制限を含む、ライセンスの条件が適用されます。
このライセンスは、研究が広く利用できるようにすると同時に、私たちのAIモデルが人類のために使われるようにするという、Stability AI の2つのコミットメントを反映しています。
https://ja.stability.ai/video
商用利用などに関しては、以下のページを参考となります。 (英語のページのほうが更新が新しいと思います。)
https://stability.ai/license
記載されているように、無料で利用できるのは Commnity ライセンスです。
本稿更新時点 (2025年5月18日) の記載から、”年間売上が100万ドル未満の研究者・開発者・小規模事業者・クリエイター向け は、Community ライセンスでの利用が可能” と解釈します。
Community
For researchers, developers, small businesses, and creators with less than $1M in annual revenue.
License includes:
https://stability.ai/license
- Stable Diffusion 3.5 Suite
- SDXL Turbo
- Stable Audio Open
- Stable Fast 3D
- View full list
Full List の中に、以下が含まれているので、以下の Stable Video Diffusion も Community ライセンスでの利用が可能と考えられます。
- Stable Video Diffusion 14-frame version
- Stable Video Diffusion 25-frame version
- Stable Video Diffusion 1.1
それぞれのモデルのライセンスのページも確認が必要です。
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid/blob/main/LICENSE.md
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt/blob/main/LICENSE.md
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1/blob/main/LICENSE.md
特に、Stable Video Diffusion 1.1 に関しては、ダウンロード前にライセンスの確認と同意を明示的に行う必要があります。
Stable Video Diffusion を使ってみる (Stability Matrix + ComfyUI で使う)
ここでは、Stability Matrix で用意した ComfyUI の環境で Stable Video Diffusion を使ってみます。
参考情報
ComfyUI の examples を参考にします。
https://comfyanonymous.github.io/ComfyUI_examples/video
PC 環境
NVIDIA GeForce RTX 5060Ti 16GBを入れて自作した PC で行います。
ComfyUI の実行環境の用意
ComfyUI は、以前 Stability Matrix で用意したものを使います。準備方法はこの過去記事をご参照ください。
モデルのダウンロード
Stable Video Diffusion のモデルファイルをダウンロードします。
(1) Hugging Face のサイトにアクセスし、右上の [Log in] からログイン後、ダウンロードします。アカウントがない場合は、[Sign Up] からアカウントを作成します。
ログイン後に以下のページに移動します。
(ログイン後にブラウザを閉じずに、別タブでそれぞれのURLを開けば、ログインした状態でそのページが確認できると思います。)
SVD と SVD XT のダウンロード
念のため、SVD と SVD XT もダウンロードしておきました。
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid/tree/main
→ svd.safetensors の右のダウンロードボタンをクリックします。

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt/tree/main
→ svd_xt.safetensors の右のダウンロードボタンをクリック

SVD 1.1 のダウンロード
この後利用するのは、こちらの SVD 1.1 です。
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1/tree/main
→ svd_xt_1_1.safetensors

SVD 1.1 は、ダウンロードに際して、huggingface へのログインとライセンスの確認と同意が必須となっていますので、それぞれ行った後にダウンロードします。




(2) ダウンロードした モデルファイルを配置します。
- StabilityMatrixのインストールフォルダ\Data\Models\StableDiffusion
例) C:\StabilityMatrix にインストールした場合
C:\StabilityMatrix\Data\Models\StableDiffusion
Stability Matrix のバージョンによっては、違うフォルダに置いたほうがよい場合があるかもしれません。本稿更新時点 (Stability Matrix 2.14.1) では上記に置くことで ComfyUI から利用できました。
(3) ComfyUI 用のワークフローのサンプルをダウンロードします。
https://comfyanonymous.github.io/ComfyUI_examples/video/
1つ目の画像の下にある Workflow in Json format を右クリックし、名前を付けて保存で保存します。

もし、画像からの生成ではなく、テキストから動画の生成を行う場合は、2つ目の画像の下の Workflow in Json format を右クリックし、名前を付けて保存で保存します。

ComfyUI の起動とワークフローの実行
(1) Stability Matrix から ComfyUI を起動します。
Stability Matrix を起動 – 左側 [パッケージ] – ComfyUI – Launch

表示された URL (http://127.0.0.1:8188 など) にブラウザでアクセスします。
(2) 保存していた workflow_image_to_video.json ファイルをドラックアンドドロップします。

ここでは、モデルとして Stable Video Diffusion 1.1 の利用と、元となる画像の指定、出来上がりの Video のサイズ を指定するために、以下の部分を変更しています。
ノード名 | 選択項目 |
---|---|
画像のみのチェックポイントローダー (img2vidモデル) | ckpt_name として svd_xt_1_1.safetensors を選択する |
画像を読み込む | [アップロードするファイルを選択] をクリックして画像を選択する。 |
SVD_img2vid条件付け | 幅 : 512 高さ : 512 |

(3) [実行する] をクリックして 生成します。
(実行する ボタンが見つからない場合は、ブラウザのウィンドウを最大化すると端のほうに見えることがあります。)
私の環境で 生成には 26秒くらいかかっています。

生成した webp ファイルは以下です。
(seed によっては不自然な video も生成されましたが、比較的よさそうなものをサンプルとして置いておきます。)

参考となれば幸いです。
▼ 関連