【2023年版】Stable Diffusion イラスト生成モデル紹介・一覧

AIイラスト

2023年1月現在Stable Diffusionで美少女イラスト生成に使えるモデルを紹介します。

基本的に学習モデルの収集はここから行っています。

Models - Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

hugging face

AI版Github。5gbくらいある学習モデルも数分でダウンロードできるサーバーに、一部モデルのDEMOサイト用のGPUを提供している。これがなぜ無料で使えるのかわからないが、噂によるとAI業界のGithubという触れ込みで各企業からお金を集めているらしい。

ソート欄からLikeが多い順に並べ替えてください。

ここで紹介しているものはSDの学習モデルのほんの一部です。海外(とくに中国語コミュニティ)にはもっと色々なモデルもあります。最新情報を追いたい人はここか5chかreditt、イラストAIを研究しているディスコードなんかで探せますので探してみてください。

私の体感だと日本語コミュニティでは5chが最先端です。10スレくらい読み込めば国内外含めての最先端に追いつけるはずなので時間のある方は見に行ってみてください。

最新のSDの環境導入方法やイラスト生成のコツなんかをまとめた記事を書きました。かなり読み応えのある記事になっています。

2023年3月版の導入方法をまとめました。プログラム何もわからなくてもControlNetとLoraの使い方がわかります。

読みにくかったので最後にまとめて比較することにしました。各モデル紹介では数枚そのモデルで出力したイラストを貼ります。

プチ解説 .ckptと.safetensorsってどう違うの?

safetensors の方はPythonに最適化されたモデルらしく読み込みが早い。基本的にどちらの形式でもmodelフォルダに入れれば同じように動くので迷ったら汎用性の高いckptの方をダンロードしておこう。safetenorのほうがウイルスを組み込める領域が少ないらしく、怪しいファイルの場合はsafetenorのほうが安全そう。

最近では safetensors のほうが主流。追加学習でも問題なく使えるので safetensors の方を使うのがおすすめ。

プチ解説 fp16 .prunedってどう違うの?

オリジナルのモデルデータの軽量版。基本的にはオリジナルでよい。VRAM<モデルの容量の場合読み込めないのでこれらを使う。生成結果はほぼ変わらないが若干の違いがある。容量の小さいバージョンを使う場合はstep数を多めに設定するとよりオリジナル版に近い生成結果が得られる。

用語解説

stable diffusion:SD
2022年に登場したテキストをイラストに変換できるとってもすごいAIの基幹技術。このSD上で様々なイラストを学習させたモデルを動かすことでイラストを生成できる。他にも色々な機能がある。イラストAIとしてはmidJourneyなんかがあるが、SDが頭一つ抜けて流行っている。

モデル
Anythingやabyssorangemixを始めとするAIの種類のこと。モデルごとに特徴が異なる。

NovelAI:NAI
AIに小説を書かせるサービスを提供している会社またはサービスのこと。AIイラスト界隈では主にNovelAIが開発したモデルのことを指す。美少女イラストAIに革命をもたらしたモデルでありNAIがなければこの業界の歴史は語れない。生物学におけるパスツール。物理学におけるニュートンみたいな存在。現在流行っているモデルはすべてこのNAIの血を引いていると言っても過言ではない。

Automatic1111 webui
stable diffuisionをwebアプリで使えるようにしたやつ。更新が早く使いやすくて機能が多い。ほとんどの人がこれを使ってAIイラストを楽しんでいる。1111とかwebuiとか呼ばれてる。

プロンプト
いわゆる呪文のこと。AIイラストは国際的に研究されているのでpromptで覚えておこう。webuiの上のほうがpromptで下がNegative prompt。Negative promptは書き込んだ様子を否定することで生成物をコントロールする。

VAE
AIイラストにおける色味を決めるファイル、設定。現在のAIイラストは「モデル+VAE」を指定することで出力している。下はその比較。モデルは何種類もあるがVAEはこの3つを覚えておけばいい。

vae-ft-mse-840000-ema-pruned.safetensors
…実写用。
anything-v4.0.vae.pt
…アニメイラスト向け。ちょっとくすんだ色で出力できる。最近の流行り
kl-f8-anime2.ckpt
…アニメイラスト向け。比較的鮮やかな色味で出力できる

モデル紹介

倫理的問題
★ :NAIリークモデルがマージ元になっている。
★★ :NAIリークモデルが含まれている可能性が高い。
★★★ :NAIリークモデルは含まれていないものの、無断転載画像の学習やイラストレーターさんのお気持ち問題などは解決出来ていないモデル。
★★★★ :できる限り問題ないデータセットを用いて、日本の「AIにの学習に画像を使用することは問題ない」という法解釈上おそらく問題ないモデル。
★★★★★:フリー素材のみをデータセットに使っているモデル。

商用利用について
ご存知の方は多いかと思いますが現在のAIイラスト最前線で活用されているモデルはリーク版NovelAIをマージ元として使っているものがほとんどです。本記事では配布元の記載にかかわらず、リーク版NAIモデルが含まれている可能性があるモデルはすべて商用利用×という風に記載しています。商用利用については配布元を良く読んだ上で自己判断および自己責任でお願いします。

実写系

実写系はすべて画像を消しました。生成結果はリンク先か自分でダウンロードして確かめたください。

stable-diffusion-2-1

実写系適正 ★★★★★
イラスト適正 ★★
NSFW適正 ★
倫理的問題 ★★★★
商用利用 ◎

stabilityai/stable-diffusion-2-1 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

stable-diffusion公式が配布しているモデル。実写用なので美少女イラストを生成するのには適していませんがイラストAIの根幹をなす大元のモデルということでとりあえず経験しておきましょう。

私の環境では動かなかったのでcolab版しか試していません。colab版ではNSFWは試せませんがおそらくローカル版では可能です。

dreamlike-art

実写系適正 ★★★★★
イラスト適正 ★★
NSFW適正 ★★★★
倫理的問題 ★★★
商用利用

dreamlike-art/dreamlike-photoreal-2.0 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

本家SDから派生した実写系モデル。ckptファイルが2.5gbくらいなので軽いのがグッド。実写系はあんまり詳しくないのでタグとScaleの設定がわかりませんが上の検証結果を見る限りではScaleとstep数のバランスが大事っぽい。

モデル名の記載とライセンスへのリンクを添付すれば商用利用可能な実写系モデル。生成物は10人以下のチームでなら普通に商用利用してもいいとある。(詳細は上のページのリンクからライセンスを確認してください。)

実写なのにNSFWも可能らしく学習元のサイズも大きいので高精細な出力が可能。これでNSFWタグを回すと洋モノのそれが出力できる。

もうすぐdreamLikeのアニメ版が出るらしいのでそちらにも注目です。

basil_mix

実写系適正 ★★★★★
イラスト適正 ★★
NSFW適正 ★★★★
倫理的問題 ★★
商用利用
× NAIマージモデルを使用している可能性がある。

nuigurumi/basil_mix · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

danbooruタグを利用可能な実写系モデル。つまりnovelAIのノウハウで実写系のイラストが生成できる。顔も本家SDのモデルとは違いアジア系の顔を出力できる。

美少女イラスト方面ではマージ素材としてよく使われる。NSFWも可能だが工夫しないと不気味の谷のどん底を超えられない。

ChilloutMix

実写系適正 ★★★★★
イラスト適正 ★★
NSFW適正 ★★★★
倫理的問題 ★
児童ポルノやディープフェイクポルノの問題があるため削除された
商用利用
×
NAIマージモデルを使用している可能性がある。

ChilloutMix - Chilloutmix-Ni-pruned-fp32-fix | Stable Diffusion Checkpoint | Civitai
This model has been republished and its ownership transferred to Civitai with the full permissions of the model creator. They have asked that all i...

コスプレ美女を出力できることで話題になったモデル。最近は実写モデルが流行っているので紹介します。BASILmixをマージしたモデルのようでdanbooruタグで操作できる。

NSFWが可能であったり、ディープフェイクポルノだったりとNovelAIの件が霞むほどの倫理的問題が潜んでいるので利用者のモラルを問われる。配布元のCivitaiではModelランキング人気1位になっており改めて実写系モデルの需要がわかる。

色々と話題になりすぎたので削除された。現在Chill Outの後継モデルが投稿されているので探すとみつかる。

7th_JP_test

実写系適正 ★★★★★
イラスト適正 ★★
NSFW適正 ★★★★
倫理的問題 ★

商用利用
×
NAIマージモデルを使用している可能性がある。

syaimu/7th_JP_test · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

7thシリーズの作者さん作の実写系モデル。ChillOutmix削除以降、複数のジェネリックChilloutモデルの一つ。サンプルは結構いい感じ。

美少女イラスト系

Waifu Diffusion 1.4

実写系適正 ★
イラスト適正 ★★★★
NSFW適正 ★★★
倫理的問題 ★★★
商用利用 ◎

hakurei/waifu-diffusion · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

商用利用可なモデル。海外の有志の人が大量のGPUで学習させた比較的倫理的問題をクリアできているモデル。バニラのNAIに劣らないくらいの強さでイラストを生成できる。今後はこのモデルが主流になっていくはずなので今のうちに使いこなせるといいかも。もうすぐ大本命のWD1.5も登場予定みたいです。

導入にはyamlという設定ファイルが必要です。

.ckptと.yamlのファイルを両方modelフォルダに入れてください。

waifu-diffusion/wd-1-5-beta2

実写系適正 ★
イラスト適正 ★★★★
NSFW適正 ★★★
倫理的問題 ★★★
商用利用 ◎

2023年3月5日追記

waifu-diffusion/wd-1-5-beta2 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

満を持して登場したwaifu diffusionシリーズの最新作の2epoch目。つまりまだ2割の力しか出していない(ここからあと80%性能が良くなる訳では無い)。

これ以降に紹介するNovelAI派生モデルとの決定的な違いはAIイラスト界隈の倫理的問題であるNAIリークモデルと違い、1から学習したモデルであること。これによってイラストレーターさんのお気持ち以外の倫理的問題を概ね解消できる。

特徴としてはREALISTICプロンプトをいれたようなリアルよりのイラストを生成できる。おそらく本家SDをベースに学習しているため2epochではまだ2次元イラスト用に染まりきっていないことが原因。

クオリティはバニラのNAIといい勝負ではあるが、LoraやControlNetなどこれまで積み上げられてきたSD1.5世代の資産が使えない点がデメリットとして大きい。とは言えこれで大手を振って美少女系イラストAIを商用利用可能となった。

dreamlike-anime-1.0

実写系適正 ★
イラスト適正 ★★★★
NSFW適正 ★★★
倫理的問題 ★★★
商用利用 ◎

dreamlike-art/dreamlike-anime-1.0 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

待望のNAIの血が入っていないモデル(マージ元にリーク版NovelAIが含まれていない)商用利用可能なモデル。Danbooruタグが効くので学習もとはDanbooruっぽい?NovelAI方式で学習されている可能性はたかい。

Qualityとしては最先端のNAIマージモデルには劣るが、プロンプト次第かも知れない。NSFWも可能ではあるが人体構造とプロンプト研究が必要。

LoraやControlnetも一応効くっぽいので今まで作り上げられてきたNAI向けの追加学習資産を活用できそう

手や人体構造の精度が初期のNAIを思い出させる。実写モデルをいい感じに階層マージするといい感じになるかもしれない。WD1.5と合わせてマージモデルの研究が進めばAIイラスト業界のNAIリークモデル問題を解決できそう。

novelAI派生

novelAI

実写系適正 ★★
イラスト適正 ★★★★
NSFW適正 ★★★★
倫理的問題 ★★★
商用利用
本家WEB版であれば○ 流出版は×

AIイラストに革命をもたらしたすべての原点であり元凶。現代的なイラストを生成できる。AnythingやそのマージモデルもこのnovelAIの派生らしい。WD1.4の登場でその役目を終えそうではあるがまだまだ現役のモデル。

絵柄はアニメ塗りでNSFWもSFWもバッチリ出力可能。イラストAI初めての人はまずはこのモデルから触ってみてください。

novelAI leak ckptなんかで検索すると入手できるはず。

Anything 3.0

実写系適正 ★★
イラスト適正 ★★★★★
NSFW適正 ★★★
倫理的問題 ★
商用利用 ×
※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

Linaqruf/anything-v3.0 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

現状(2023年1月)において最もかわいいキャラクターを出力できる学習モデル。NovelAIから派生したモデルらしく。novelAIの汎用性と美少女イラスト適正を残しながらもより現代的なイラストを出力できる。光や影の描写の制度が高く、顔も整っていて、ダンボールタグによるpromptの効きもいい感じ。出自は不明で作者はNovelAIは関係ないと言っているが真相は不明。現状最も人気の高いモデルではあるが権利的・倫理的にはグレー。

anything-v4.0/4.5

2023年1月15日 追記

404 – Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

突然登場したAnythingの後継。どうやらv3とは作者が違うので正当な後継というわけではなさそう。美少女イラストもここまで来るともはや良し悪しの判断が個人の好みによって分かれるレベルになる。ダンボールタグも使えるのでv3に飽きた方は使ってみるのもいいかも。4.5のほうが破綻が少ない気がする。

簡単に比較してみる

シード固定とプロンプトを固定すると構図がおなじになるので明らかにAnythingの系譜であることは確か、Anythingに比べて骨格や筋肉の付き方がリアルっぽいので実写の写真を素材として追加で学習させているっぽい。ここまで来ると好みの問題でしかないので最新版のほうが優れているというわけではなさそう。

OrangeMixs

実写系適正 ★★
イラスト適正 ★★★★★
NSFW適正 ★★★★★
倫理的問題 ★
商用利用 ×
※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

WarriorMama777/OrangeMixs · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

最強美少女イラストAI AnythingをベースにnovelAIとgape(実写の混ぜると人体構造が改善するやつ)とかインスタグラムの写真をマージしたモデルらしい。背景や手指、体の構造がきれいに出力できる。

_base : SFW😉 全年齢向け
_Night : SFW ~ Soft NSFW🥰
_half : SFW ~ NSFW👄

と分かれているので目的によって使い分けるのがグッド。色々種類があるがBloodNightorangemixがアニメ塗りに適している。

現状(2023年1月)美少女イラストを生成するのにもっとも適したモデル

Abyss_7th シリーズ

実写系適正 ★★
イラスト適正 ★★★★★
NSFW適正 ★★★★★
倫理的問題 ★
商用利用 ×
  ※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

Abyss_7th_anime_v1.1
abyss_7th_layerG1/concept art, multiple views,
Abyss_7th_anime_v1.1
abyss_7th_layerG1
syaimu/7th_Layer · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

5chの有志が作成したモデル。階層マージ(各モデルの重みや引き継ぎたい要素を調整しながらマージできる技術)でAnythingにいろいろ混ぜたモデル。性能はorangemixsに似たりよったり、アニメ塗り寄りのモデルと実写塗り寄りのモデルが存在する。orangemixシリーズとは好みで使い分ける。

7th_anime

実写系適正 ★★
イラスト適正 ★★★★★
NSFW適正 ★★★★
倫理的問題 ★
商用利用 ×
  ※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

syaimu/7th_Layer at main
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

ABCに分かれてそれぞれ使い分けが可能な5chコミュニティで人気のモデル。上のURLのサンプルを見れば分かる通り

A:実写
B:中間
C:アニメ

と言った感じで使い分けが可能。ダンボールタグ由来のpromptの効きもよく。更新も早い。

7th_anime_v2_C
ネガティブに(3d:1.2)

7thシリーズの作者の新作。かなりアニメ塗り寄りのモデルで世界樹シリーズみたいな質感のイラストが生成できる。アウトライン強めでデフォルメに適している。非常に完成度が高くSFWでアニメ塗りのイラストを出力するならコレをおすすめしたい。

最近の私のお気に入り。

AbyssOrangeMix / AbyssOrangeMix2 / AbyssOrangeMix3

実写系適正 ★★
イラスト適正 ★★★★★
NSFW適正 ★★★★★
倫理的問題 ★
商用利用 ×
 ※下のサイトでは商用利用可とあるがリーク版NAIモデルがマージ元となっている可能性があるため自己責任で

WarriorMama777/OrangeMixs · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

orangemixの作者が先に紹介した階層マージ機能を使ってorangemixを更に強化したモデル。おそらく現時点での美少女イラストAI最先端モデル。NSFWを出力すると体だけ実写で顔はアニメみたいな感じになる。好みは分かれるのでアニメ塗りが好きなら他のやつを使おう。

AbyssOrangeMix3

2023年2月19日追記

AbyssOrangeMixシリーズの後継。

A1 アニメより
A2 油絵より。Counterfeit-V2.5みたいな塗り。
A3 A1とA2の中間。

と言った感じで使い分けができる。今までは分かれていたNSFWとSFWが一体となっており、軽量化されて使いやすい。マージ元も公開してあるので階層マージの参考にもなる。体感A2はScaleが高いと破綻しやすい。A3はアニメと実写の要素がいい感じにマージされていておすすめです。

cinnamon_mix

実写系適正 ★★
イラスト適正 ★★★★★
NSFW適正 ★★★★
倫理的問題 ★
商用利用 ×
 ※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

nuigurumi/cinnamon_mix · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

上のorangemixシリーズに比べてふわふわした質感が特徴の学習モデル。

pastel-mix

実写系適正 ★★
イラスト適正 ★★★★★
NSFW適正 ★★★
倫理的問題 ★
商用利用 ×
 ※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

404 – Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

パステル調のイラストを出力できるモデル。ある程度ダンボールタグを効くのでいろんな構図、キャラで出力できる。

Samplerと.vaeが指定されているのでちゃんと設定しないといい感じにパステル調になりません。背景の塗りと遠近感がいい感じです。

8528diffusion

実写系適正 ★★
イラスト適正 ★★★★
NSFW適正 ★★
倫理的問題 ★★★
商用利用

note ご指定のページが見つかりません
404 – Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

AIイラスト界隈でも有名な852話さん(←Twitter)が主体となって作成したモデル。

NAIベースではなく本家SDをベースに10000枚以上のイラストを使い学習させたモデル。絵柄はどちらかといえばアニメより、まんが雑誌の表紙みたいな塗りで私は好き。クオリティもWD1.4に引けず劣らずといった出来で、流出したNAIを使ったものとは違い比較的倫理的問題をクリアしている。

ただしダンボール由来のpromptが効きにくいのでNovelAIとは別のノウハウが必要。服装などを指定してもその通りにならないことも多く。こだわるならやはりNovelAI派生のモデルのほうが適している。

BPModel

実写系適正 ★
イラスト適正 ★★★★★
NSFW適正 ★★★
倫理的問題 ★★★
商用利用

Crosstyan/BPModel · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Crosstyan(←Twitter)という方がSankaku Complex(※よい子は調べちゃダメ)からタグ付きの好みの画像を選んで学習させたモデル。人力で好みの画像をピックアップしているだけあって絵柄は現在のオタクに非常に刺さる。というより私はすごく好み。同じpromptでもシードごとに全く絵柄が違う。

sketchのプロンプトを使うことで特徴的なクレヨン塗りみたいな絵柄のイラストを出力できるっぽい。使わなくても強めのアウトラインが特徴的なイラストが出力できる。 上の検証結果ではstepとScale次第でだいぶ絵柄が変わるがこれはおそらくダンボールのタグとSANKAKUのタグが微妙に違うことが原因でワイルドカードで選択された一部のpromptが機能したりしてなかったりするせい。

学習元のデータセットが公開してあるが Sankaku Complex自体がグレーであるため、倫理的問題をクリアできているかというとそうでもない。

LimeMix・Date Mix・Plum Mix・Pear Mix・Longan Mix

実写系適正 ★★
イラスト適正 ★★★★★
NSFW適正 ★★★★
倫理的問題 ★
商用利用 ×
 ※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

Hemlok (Hemlok_AI)
User profile of Hemlok_AI on Hugging Face

Hemlok(←Twitter)さんという方が

・LimeMix →Anything4.5を階層マージ(イラスト寄り)
・Date Mix →Anything4.5を階層マージ(リアル寄り)
・Plum Mix →abyssorangemix2を階層マージ
・Pear Mix →Plum mixを階層マージしてよりリアル寄りに
・Longan Mix →7th Layerを階層マージ

して作られたモデル。

もともと完成度の高いモデルを利用して自分好みにマージして使うという使い方の例。イラスト寄りとリアルよりのモデルの使い分けも可能で使い勝手がよく5chコミュニティでも使用している人もよく見る。

CCCmix

実写系適正 ★
イラスト適正 ★★★★★
NSFW適正 ★★★★
倫理的問題 ★
商用利用 ×
 ※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

taron88/CCCmix · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

公開されているモデルを単純マージしたモデルです。

7th v3.0 CをベースにCinnamonmixとCounterfeit-V2.5をマージしました。

7th v3.0 CをAに配置してB,CにCinnamonとcounterfeitを配置。 設定はWeighted sumの0.5だったと思います。

7thCのアニメ寄りのイラストはそのままにCinnamonの塗りと雰囲気、counterfeitの背景の精度を目指しました。最近はこれを使っています。

Counterfeit-V2.5

2023年2月4日 追記

実写系適正 ★
イラスト適正 ★★★★★
NSFW適正 ★★★★
倫理的問題 ★
商用利用 ×
  ※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

gsdf/Counterfeit-V2.5 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Counterfeitシリーズの新作。huggingface側に詳細が書かれていないのでどうやって作ったとかは謎。推奨されているembeddingのEasyNegativeというのはネガティブプロンプトの詰め合わせみたいなもので上のページの使い方の通り、ダウンロードしたEasyNegative.safetensorというファイルをwebui上のembeddingというフォルダに入れて、ネガティブプロンプト欄に「EasyNegative」といれて使う。複数のプロンプトを概念的にネガティブに叩き込むことで飛躍的に生成物の品質を上げることができる。

背景の精度が非常に高く。アメリカのスーパーマーケットやコーヒーショップみたいな背景が得意っぽい。1girlの精度も非常に高く破綻も少ないので非常に完成度が高いモデル。武器の精度も高め

モデルのサイズが7.7GBとかなり大きいファイルでVRAM8gb以上のGPUでかろうじて読み込める。其れ以下のGPUを使っている人はCounterfeit-V2.5_fp16.safetensorsか.prunedと書いてある方を選択してstep数を多めに設定するとオリジナルと同じ生成結果が得られる。

Counterfeit-V2.0

2023年1月16日 追記

実写系適正 ★
イラスト適正 ★★★★★
NSFW適正 ★★★★
倫理的問題 ★
商用利用 ×
  ※リーク版NAIモデルがマージ元となっている可能性があるため自己責任で

gsdf/Counterfeit-V2.0 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

ドリームブースと階層マージ、Lora(最近流行ってる学習技術)を駆使して作成されたモデル。サンプルはブルーアーカイブっぽいイラストを出力している。厚塗りで女の子もかわいい。銃も比較的それっぽいものが出力されている。ダンボールタグも効くので使い勝手もいい。NSFWもかなり精度良く出力でき、人体の破綻も少ない。

背景が非常にうまく出力されているので写真由来の学習本も使っていそう。

マージ元が書いていないので不明な部分も多いがかなり完成度が高い。

Cool Japan Diffusion

実写系適正 ★
イラスト適正 ★★★
NSFW適正 ★★
倫理的問題 ★★★★
商用利用 ×

aipicasso/cool-japan-diffusion-for-learning-2-0 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

日本の法律で問題ないことを目標に作られたモデル。ではあるが別に無断転載されたイラストを1枚も学習していないかというと、多分そうでもないので完全に白ではない。

現時点では商用利用不可ということだが、今後商用利用可能になるらしい。NAIに比べて弱いが健全でいたい方は使ってみるのもあり。

導入にはyamlという設定ファイルが必要。

picasso-diffusion

実写系適正 ★
イラスト適正 ★★★
NSFW適正 ★
倫理的問題 ★★★★
商用利用 ×

Emix Turbo - a Hugging Face Space by aipicasso
Discover amazing ML apps made by the community

こちらはモデルデータでの提供ではなくデモサイト。非商用利用のモデルであり名前からも分かる通りai picassoという会社が主だって作成したモデル。美少女イラスト用途としてはNovelAIやWD1.4に及ばないが倫理的問題の大部分をクリアしており、

「NAIのリークモデルのマージモデルが跋扈するAIイラスト業界に一石を投じるモデル(作者談)」とのこと。

NSFWは数枚試してみたところ一応出力可能。AIイラスト初期の頃(NAI登場前)の用に人体構造が苦手。danbooruタグで学習しているわけではないため従来のNAIのノウハウが生かせない。

NAIのリークモデルを利用するのに抵抗があるという方は一度試してみる価値のあるモデル。

あんまり流行ってないやつ

Trinart

404 – Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

かなり初期の方からあるイラスト生成モデル。NAIを始めとする最新イラストAIに比べると弱いがファンタシー路線の背景を出力するには強いらしい。上は大元のtrinartから美少女イラストの出力用にチューニングしたモデルらしい。

Openjourney

prompthero/openjourney · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

アメコミに特化したモデル。midjourneyのSD版だと考えるといい。

一括比較

検証1 ランダム 1girl

検証設定

1girl, __haircolor__,__hairstyle__,__hairstyle__,__viewfrom__,__eyecolor__,__breasts__,__jaket__,__tops__,__pants__

Negative prompt: (worst quality:1.4), (low quality:1.4) , (monochrome:1.1),nsfw,nipples,
Steps: 36, Sampler: Euler a, CFG scale: 4,8,12,16,20, Size: 512×512, clip skip:1,2,3

https://taron88wordpress.net/wp-content/uploads/2023/01/wildcards.zip

上のwildcardを使った設定で色々な1girlを生成します。Y軸は迷いましたが、今回は今までなんとなくで1か2にしていた clip skip で検証してみます。

結果

wd-1-4-anime_e1
wd-1-4-anime_e1 best quality,masterpieceを追加
Anything-V3.0
BloodNightOrangeMix
Abyss_7th_anime_v1.1
abyss_7th_layerG1
AbyssOrangeMix_base
AbyssOrangeMix2_sfw
7th_anime_v2_C
8528d-final
bp_1024_e10

検証2 シード固定 うちの子立ち絵

検証設定

1girl,ahoge, bangs, bare_shoulders, blush, collarbone, hair_between_eyes, long_hair, purple_eyes, red_hair,
, denim, denim_shorts, hood, hooded_jacket, hoodie,deep blue jacket, purple_eyes, red_hair, shoes, short_hair, shorts, sneakers, solo, sports bra, medium breasts,full body, holding phone, looking away, standing, outdoors,

Negative prompt: (worst quality:1.4), (low quality:1.4) , (monochrome:1.1),nsfw,nipples,
Steps: 36, Sampler: Euler a, CFG scale: 4,8,12,16,20, Size: 512×768

上の設定で回していきます。シードはモデルごとにランダムで3回実行して筆者が一番いいものを選んでいます。.vaeはAnything3のものを使います。
人体の破綻がわかりやすいように bare_shoulders ,full body, standing
指の破綻がわかりやすいように holding phone,
背景の検証のために outdoors

結果

wd-1-4-anime_e1
wd-1-4-anime_e1 にbest quality,masterpieceを追加
Anything-V3.0
BloodNightOrangeMix
Abyss_7th_anime_v1.1
abyss_7th_layerG1
AbyssOrangeMix_base
7th_anime_v2_C
8528d-final
bp_1024_e10

まとめ

最後に私が言えることではありませんが一応予防線貼っときます。

これらのAIモデルは日本でも海外でもどう扱っていいかまだ決めかねている状態です。現在はグレーゾーンということで楽しんでいますが今後どうなるかはわかりません。

これらの学習モデルの利用はすべて

自己責任

でお願いします。

コメント

タイトルとURLをコピーしました