ジャコ Lab

プログラミング関連のメモ帳的ブログです

wd14-tagger のタグ付けについて調べたこと

kohya-ss/sd-scripts自動キャプショニング の項目を調べていて、 DeepDanbooru のほかに WD14Tagger というものがあることがわかっています。しかも WD14Tagger のほうが精度が良いかもしれない という記載もあります。

この記事では WD14Tagger を使う上で、
AUTOMATIC1111/stable-diffusion-webui を準備しなきゃいけないか? などと色々調べたことを書いておきます。

ちなみに DeepDanbooru は以下の記事で試しています。

WD14Tagger 使いたいけど使えないかも?やっぱ使えるかも?なメモです

WD14Tagger とは?

github.com

Tagger for Automatic1111's WebUI とされており、 Stable Diffusion WebUI の拡張機能として存在している模様。

ということは WebUI の環境を作らなきゃいけない?

Diffusers をメインに使っているので WebUI の環境作ってないんだよなぁ

と思いつつ、 WD14Tagger を使うのを諦めかけていました。

環境汚したくないし Docker あるかな?

github.com

なんかあるっぽいのでメモ

WebUI 無しで WD14Tagger 動かせないのかな?

corkborg.github.io

なんと WebUI 拡張機能 から、単体で動かせるように作っている方がいました

Stable Diffusion で LoRA を作成する際の定番プラグイン という記載もあり、
みんなこういうのでタグ付けしているのかー。っていうことがわかりました。

よくよく読んでみると kohya-ss さんもスクリプト作ってそう

Automatic1111氏のWebUIで使用しているtaggerを利用します。こちらのgithubページ(https://github.com/toriato/stable-diffusion-webui-wd14-tagger#mrsmilingwolfs-model-aka-waifu-diffusion-14-tagger )の情報を参考にさせていただきました。

と記載のある通り、初見では WebUI を使って Tagger を利用するものだと思ってましたが、あくまで参考にしただけのようです。
tag_images_by_wd14_tagger.py を追ってみると finetune/ にいました。

もっとよくよく読んでみると・・・

docs/ の下に wd14_tagger_README がありました。

まとめ

これで、WebUI を用意しなくても使えるかもしれないぞ!