[動画生成AI] Stable Video Diffusion 1.1 を使ってみる (Stability Matrix + ComfyUI / 2025年5月)

本サイトで紹介している商品・サービス等の外部リンクには、アフィリエイト広告が含まれる場合があります。

2025年5月18日2025年9月15日

概要

Stable Video Diffusion (SVD) は、Stability AI 社が開発したテキストや画像から動画を生成する拡散モデルです。
より新しいモデルである Stable Video Diffusion (SVD) 1.1 の環境を、ローカル PC に用意して使ってみたので情報残しておきます。

git などを直接使わずに、Stability Matrix を使って簡単に実行環境を用意できました。

NVIDIA GeForce RTX 5060Ti 16GB で SVD 1.1 がどこまで動くのかの一助になれば幸いです。

公式サイト

https://ja.stability.ai/video

モデル配布（Hugging Face）
SVD
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid
SVD-XT
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt
SVD 1.1
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1

ライセンスなど

公式ページの記載は以下です。

Stable Video ライセンス

Stable Video Diffusionを使用する前に、ライセンスを確認してください。

Stability AIは、Stable Video Diffusionを、研究およびその他の非商業的な目的のために、モデルコードおよび重みを含めて、自由に利用できるようにしています。Stable Video Diffusionの使用には、Stability AI Acceptable Use Policyに記載されている使用およびコンテンツの制限を含む、ライセンスの条件が適用されます。

このライセンスは、研究が広く利用できるようにすると同時に、私たちのAIモデルが人類のために使われるようにするという、Stability AI の2つのコミットメントを反映しています。
https://ja.stability.ai/video

商用利用などに関しては、以下のページを参考となります。 (英語のページのほうが更新が新しいと思います。)
https://stability.ai/license

記載されているように、無料で利用できるのは Commnity ライセンスです。
本稿更新時点 (2025年5月18日) の記載から、”年間売上が100万ドル未満の研究者・開発者・小規模事業者・クリエイター向けは、Community ライセンスでの利用が可能” と解釈します。

Community

For researchers, developers, small businesses, and creators with less than $1M in annual revenue.

License includes:

Stable Diffusion 3.5 Suite

SDXL Turbo

Stable Audio Open

Stable Fast 3D

View full list

https://stability.ai/license

Full List の中に、以下が含まれているので、以下の Stable Video Diffusion も Community ライセンスでの利用が可能と考えられます。

それぞれのモデルのライセンスのページも確認が必要です。
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid/blob/main/LICENSE.md
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt/blob/main/LICENSE.md
https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1/blob/main/LICENSE.md

特に、Stable Video Diffusion 1.1 に関しては、ダウンロード前にライセンスの確認と同意を明示的に行う必要があります。

Stable Video Diffusion を使ってみる (Stability Matrix + ComfyUI で使う)

ここでは、Stability Matrix で用意した ComfyUI の環境で Stable Video Diffusion を使ってみます。

参考情報

ComfyUI の examples を参考にします。

https://comfyanonymous.github.io/ComfyUI_examples/video

PC 環境

NVIDIA GeForce RTX 5060Ti 16GBを入れて自作した PC で行います。

リンク

参考

RTX 5060Ti 16GB でナイスミドルな自作PC

アプリを作りたい

ComfyUI の実行環境の用意

ComfyUI は、以前 Stability Matrix で用意したものを使います。準備方法はこの過去記事をご参照ください。

参考

Stable Diffusion の実行環境を用意する (GUI / Stability Matrix, 2024年12月)

アプリを作りたい

モデルのダウンロード

Stable Video Diffusion のモデルファイルをダウンロードします。

(1) Hugging Face のサイトにアクセスし、右上の [Log in] からログイン後、ダウンロードします。アカウントがない場合は、[Sign Up] からアカウントを作成します。

ログイン後に以下のページに移動します。
(ログイン後にブラウザを閉じずに、別タブでそれぞれのURLを開けば、ログインした状態でそのページが確認できると思います。)

SVD と SVD XT のダウンロード

念のため、SVD と SVD XT もダウンロードしておきました。

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid/tree/main
　→ svd.safetensors の右のダウンロードボタンをクリックします。

Hugging Face - Stable Video Diffusion - Files - モデルをダウンロード

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt/tree/main
　→ svd_xt.safetensors の右のダウンロードボタンをクリック

Hugging Face - Stable Video Diffusion XT - Files - モデルをダウンロード

SVD 1.1 のダウンロード

この後利用するのは、こちらの SVD 1.1 です。

https://huggingface.co/stabilityai/stable-video-diffusion-img2vid-xt-1-1/tree/main
　→ svd_xt_1_1.safetensors

Hugging Face - Stable Video Diffusion 1.1 - Files - ダウンロードにはログインが必要

SVD 1.1 は、ダウンロードに際して、huggingface へのログインとライセンスの確認と同意が必須となっていますので、それぞれ行った後にダウンロードします。

Hugging Face - Stable Video Diffusion 1.1 - Files - ログイン後

Hugging Face - Stable Video Diffusion 1.1 - Files - License Agreement の確認

(2) ダウンロードしたモデルファイルを配置します。

StabilityMatrixのインストールフォルダ\Data\Models\StableDiffusion
例) C:\StabilityMatrix にインストールした場合
　　C:\StabilityMatrix\Data\Models\StableDiffusion

Stability Matrix のバージョンによっては、違うフォルダに置いたほうがよい場合があるかもしれません。本稿更新時点 (Stability Matrix 2.14.1) では上記に置くことで ComfyUI から利用できました。

(3) ComfyUI 用のワークフローのサンプルをダウンロードします。

https://comfyanonymous.github.io/ComfyUI_examples/video/

１つ目の画像の下にある Workflow in Json format を右クリックし、名前を付けて保存で保存します。

ComfyUI_examples - Video Examples - Image to Video のワークフローをダウンロード

もし、画像からの生成ではなく、テキストから動画の生成を行う場合は、2つ目の画像の下の Workflow in Json format を右クリックし、名前を付けて保存で保存します。

ComfyUI_examples - Video Examples - Text to Video のワークフローをダウンロード

ComfyUI の起動とワークフローの実行

(1) Stability Matrix から ComfyUI を起動します。

Stability Matrix を起動 – 左側 [パッケージ] – ComfyUI – Launch

表示された URL (http://127.0.0.1:8188 など) にブラウザでアクセスします。

(2) 保存していた workflow_image_to_video.json ファイルをドラックアンドドロップします。

ダウンロードしてあった workflow_image_to_video.json を開く

ここでは、モデルとして Stable Video Diffusion 1.1 の利用と、元となる画像の指定、出来上がりの Video のサイズを指定するために、以下の部分を変更しています。

ノード名	選択項目
画像のみのチェックポイントローダー (img2vidモデル)	ckpt_name として svd_xt_1_1.safetensors を選択する
画像を読み込む	[アップロードするファイルを選択] をクリックして画像を選択する。
SVD_img2vid条件付け	幅 : 512 高さ : 512