Stable Video Diffusion 1.1 を使ってみる (Stability Matrix + ComfyUI / 2025年5月)

本サイトで紹介している商品・サービス等の外部リンクには、アフィリエイト広告が含まれる場合があります。

概要

Stable Video Diffusion (SVD) は、Stability AI 社が開発したテキストや画像から動画を生成する拡散モデルです。
ここでは ローカル PC 上の、より新しいモデルである Stable Video Diffusion (SVD) 1.1 の環境を用意して使ってみたので情報残しておきます。

git などを直接使わずに、Stability Matrix を使って簡単に実行環境を用意できました。

NVIDIA GeForce RTX 5060Ti 16GB で SVD 1.1 がどこまで動くのか の一助になれば幸いです。

生成したファイル

公式サイト

https://ja.stability.ai/video


モデル配布(Hugging Face)
SVD
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid
SVD-XT
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt
SVD 1.1
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1

ライセンスなど

公式ページの記載は以下です。

Stable Video ライセンス

Stable Video Diffusionを使用する前に、ライセンスを確認してください。

Stability AIは、Stable Video Diffusionを、研究およびその他の非商業的な目的のために、モデルコードおよび重みを含めて、自由に利用できるようにしています。Stable Video Diffusionの使用には、Stability AI Acceptable Use Policyに記載されている使用およびコンテンツの制限を含む、ライセンスの条件が適用されます。

このライセンスは、研究が広く利用できるようにすると同時に、私たちのAIモデルが人類のために使われるようにするという、Stability AI の2つのコミットメントを反映しています。

https://ja.stability.ai/video

商用利用などに関しては、以下のページを参考となります。 (英語のページのほうが更新が新しいと思います。)
https://stability.ai/license

記載されているように、無料で利用できるのは Commnity ライセンスです。
本稿更新時点 (2025年5月18日) の記載から、”年間売上が100万ドル未満の研究者・開発者・小規模事業者・クリエイター向け は、Community ライセンスでの利用が可能” と解釈します。

Community

For researchers, developers, small businesses, and creators with less than $1M in annual revenue.


License includes:

  • Stable Diffusion 3.5 Suite
  • SDXL Turbo
  • Stable Audio Open
  • Stable Fast 3D
  • View full list
https://stability.ai/license

Full List の中に、以下が含まれているので、以下の Stable Video Diffusion も Community ライセンスでの利用が可能と考えられます。

それぞれのモデルのライセンスのページも確認が必要です。
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid/blob/main/LICENSE.md
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt/blob/main/LICENSE.md
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1/blob/main/LICENSE.md

特に、Stable Video Diffusion 1.1 に関しては、ダウンロード前にライセンスの確認と同意を明示的に行う必要があります。

Stable Video Diffusion を使ってみる (Stability Matrix + ComfyUI で使う)

ここでは、Stability Matrix で用意した ComfyUI の環境で Stable Video Diffusion を使ってみます。

参考情報

ComfyUI の examples を参考にします。

https://comfyanonymous.github.io/ComfyUI_examples/video

PC 環境

NVIDIA GeForce RTX 5060Ti 16GBを入れて自作した PC で行います。

ComfyUI の実行環境の用意

ComfyUI は、以前 Stability Matrix で用意したものを使います。準備方法はこの過去記事をご参照ください。

モデルのダウンロード

Stable Video Diffusion のモデルファイルをダウンロードします。

(1) Hugging Face のサイトにアクセスし、右上の [Log in] からログイン後、ダウンロードします。アカウントがない場合は、[Sign Up] からアカウントを作成します。

ログイン後に以下のページに移動します。
(ログイン後にブラウザを閉じずに、別タブでそれぞれのURLを開けば、ログインした状態でそのページが確認できると思います。)

SVD と SVD XT のダウンロード

念のため、SVD と SVD XT もダウンロードしておきました。

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid/tree/main
 → svd.safetensors の右のダウンロードボタンをクリックします。

Hugging Face - Stable Video Diffusion - Files - モデルをダウンロード

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt/tree/main
 → svd_xt.safetensors の右のダウンロードボタンをクリック

Hugging Face - Stable Video Diffusion XT - Files - モデルをダウンロード

SVD 1.1 のダウンロード

この後利用するのは、こちらの SVD 1.1 です。

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1/tree/main
 → svd_xt_1_1.safetensors

Hugging Face - Stable Video Diffusion 1.1 - Files - ダウンロードにはログインが必要



SVD 1.1 は、ダウンロードに際して、huggingface へのログインとライセンスの確認と同意が必須となっていますので、それぞれ行った後にダウンロードします。


(2) ダウンロードした モデルファイルを配置します。

  • StabilityMatrixのインストールフォルダ\Data\Models\StableDiffusion
    例) C:\StabilityMatrix にインストールした場合
      C:\StabilityMatrix\Data\Models\StableDiffusion

Stability Matrix のバージョンによっては、違うフォルダに置いたほうがよい場合があるかもしれません。本稿更新時点 (Stability Matrix 2.14.1) では上記に置くことで ComfyUI から利用できました。

(3) ComfyUI 用のワークフローのサンプルをダウンロードします。

https://comfyanonymous.github.io/ComfyUI_examples/video/

1つ目の画像の下にある Workflow in Json format を右クリックし、名前を付けて保存で保存します。

ComfyUI_examples - Video Examples - Image to Video のワークフローをダウンロード

もし、画像からの生成ではなく、テキストから動画の生成を行う場合は、2つ目の画像の下の Workflow in Json format を右クリックし、名前を付けて保存で保存します。

ComfyUI_examples - Video Examples - Text to Video のワークフローをダウンロード

ComfyUI の起動とワークフローの実行

(1) Stability Matrix から ComfyUI を起動します。

Stability Matrix を起動 – 左側 [パッケージ] – ComfyUI – Launch

Stability Matrix - パッケージ - ComfyUI を起動

表示された URL (http://127.0.0.1:8188 など) にブラウザでアクセスします。

(2) 保存していた workflow_image_to_video.json ファイルをドラックアンドドロップします。

ダウンロードしてあった workflow_image_to_video.json を開く

ここでは、モデルとして Stable Video Diffusion 1.1 の利用と、元となる画像の指定、出来上がりの Video のサイズ を指定するために、以下の部分を変更しています。

ノード名選択項目
画像のみのチェックポイントローダー (img2vidモデル)ckpt_name として svd_xt_1_1.safetensors を選択する
画像を読み込む[アップロードするファイルを選択] をクリックして画像を選択する。
SVD_img2vid条件付け幅 : 512
高さ : 512
ワークフローを変更

(3) [実行する] をクリックして 生成します。
(実行する ボタンが見つからない場合は、ブラウザのウィンドウを最大化すると端のほうに見えることがあります。)

私の環境で 生成には 26秒くらいかかっています。

Video 生成

生成した webp ファイルは以下です。
(seed によっては不自然な video も生成されましたが、比較的よさそうなものをサンプルとして置いておきます。)

生成したファイル

参考となれば幸いです。

▼ 関連