Sulphur 2のT2Iで二次エロ動画を作ってみる実験【無検閲】

動画系

Sulphur 2が流行っています。LTX 2.3 系の動画モデルで、検閲されていないとか。つまりエロ動画をジャンジャン作れるということ。気になるので使おうと思いましたが、LTXに一切触れていなかったのもあって結構てこずりました。試してみての結果をお伝えします。

  • 実行環境:ComfyUI デスクトップ版 (electron)
  • プロセッサ AMD Ryzen 7 5700X 8-Core Processor (3.40 GHz)
  • メモリ 32.0 GB
  • NVIDIA GeForce RTX 5060 Ti (16 GB)

Sulphur 2は最低VRAM8GBで動作するそうです。もちろん解像度あたり設定を抑える必要があるので現実的ではありませんが。VRAMが足りない場合、RunpodでComfyUIを使う選択肢もありますので参考にしてみてください。

Hugging FaceのSulphur-2-baseからモデルをダウンロード

SulphurAI/Sulphur-2-base · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

モデルのAI解説

ファイル役割目安
sulphur_dev_bf16.safetensorsフル品質の本体モデル画質優先、VRAM 多め
sulphur_dev_fp8mixed.safetensors軽量化された本体モデルVRAM 節約、通常はこちらが扱いやすい
sulphur_distil_bf16.safetensors蒸留版/高速化寄りの重み速度優先、品質はやや落ちる場合あり
sulphur_lora_rank_768.safetensorsdev 本体に重ねる distill LoRAdev 本体 + LoRA で高速化

配布ページにて。

Get Started: To get started with the model, I recommend downloading either of the dev versions, (fp8mixed or bf16) and downloading the distill lora provided. By the way, I’m aware the workflows contain sulphur_final right now, just use the lora or use the full models, don’t use both at the same time.

これはおそらく、sulphur_distil_bf16.safetensorssulphur_lora_rank_768.safetensors組み合わせるなと言っている……?sulphur_finalは何を指しているんでしょうか。

Sulphur-2-base/workflowsにあるワークフローは、LTX2.3をベースにLoRAを組み合わせているようですがsulphur_finalが謎すぎて変にバイパスできません。多分sulphur_lora_rank_768のことだと思いますが……

LTX-2.3: Text to VideoをSulphur 2用に改変してみる

Sulphur 2はLTX2.3をベースにしたモデルなので、普通にComfyUIのテンプレート「LTX-2.3: Text to Video」のckptnameにあるltx-2.3-22b-dev-fp8.safetensorssulphur_dev_fp8mixed.safetensorsに差し替えればいいと思いました。

sulphur_dev_fp8mixed+ltx-2.3-22b-distilled-lora-384の生成結果

2d anime style. A light-skinned woman is straddling a man and having sex with him. She bounces up and down on top of the man. She is squatting with her knees raised. She has a pink shirt that is pulled up exposing her breasts. Her hands are resting on the man's chest. Her straight hair is long and dark. There is a clear view of her face as she opens her mouth and moans with pleasure. The light-skinned man penis is visible and you can see his legs in the background. You can see the woman bouncing up and down on the man's erect penis. You can see a library in the background. The view is POV.

生成時間:344.21秒

ネガティブプロンプトのcartoonだけ削除しました。LTX2.3はアニメ系そこまで得意でないと聞いたのであえてやってみましたが、思ったよりはいいですね。ウォーターマークが残念ですが。

LTX2.3のまま同プロンプトで生成してみるとあきらかに通りが悪くバケモンが生成されるので、ちゃんとSulphur 2の検閲なしが生かされているようです。

一応閲覧注意

sulphur_distil_bf16+LoRAバイパスの生成結果

生成時間:479.60秒

ウォーターマークもなく全体的にきれいになってますね。

Vantage-Sulphur-2-Workflowを利用する

自分のやり方が合っているのか不安で、Sulphur 2をベースモデルとして生成するワークフローを探していたところこちらを発見。

モデルの置き場所やダウンロードリンクがワークフローを見れば一目瞭然なので、これが一番初心者にやさしいのかなと思いました。

動画概要欄からWorkflowにあるワークフローを名前を付けて保存して、ComfyUIに読み込みます。モデルのダウンロードをすませつつ、Load Diffusion ModelDualCLIPLoaderを差し替えていきます。

Load Diffusion Modelなので、\models\checkpointsではなく\models\diffusion_modelsに置かないと読み込めません。チェックポイントはモデル、Clip、VAEの全部入り、拡散モデルはモデル部分だけなんですね。

ワークフローの差し替え場所

MelBandRoformer_fp32.safetensorsはリップシンクに関するものと思われるので、バイパスしても問題なかったです。ダウンロードも不要。

Width,Heightの右隣に動画の長さが隠れています。デフォルトは15秒。とりあえず5秒程度にしてみては。

生成が固定されないようにランダムに変更。

生成結果 (231.25秒)

とりあえずスピードは上がってます。品質は若干落ちてますかね……デフォルトのネガティブプロンプトの影響もあるかと。

生成崩壊例

Get StartedのフルモデルとSulphur 2LoRAを組み合わせるな、の意味が分かった気がします。

  • ltx-2.3-22b-dev-fp8.safetensors+sulphur_lora_rank_768
  • sulphur_dev_fp8mixed.safetensors+LoRAバイパス

総評

Wan2.2と比べると、勝手に音声も作ってくれるのがありがたくもあり、邪魔でもあり。あえて苦手なアニメ系をやらせましたが動きは悪くなかったので、実写では単体で動作するエロ動画モデルとして重宝されそうです。I2Vも試してみたいですね。

コメント

タイトルとURLをコピーしました