corkborg 産の WD14Tagger と kohya-ss 産の WD14Tagger の比較！

kohya-ss 産 corkborg 産どちらかというとスクリプトの違いよりモデルの違いの方が影響が強いと思いますが、両方使えたので残しておきましょう！モデルの切り替え方もメモっとこう

#Stable Diffusion #Image Captioning #ずんだもん

2024-08-29

corkborg 産の WD14Tagger も使用してみる

zako-lab929.hatenablog.com kohya-ss 産 WD14Tagger を使用してみましたが、先日の調査によると、他にもコマンドラインから使用できるようにしてくれている方がいました。先日の調査 zako-lab929.hatenablog.com 本日は corkborg/wd14-tagger-standalone …

#Stable Diffusion #Image Captioning

2024-08-28

WD14Tagger と DeepDanbooru の出力結果を比較する

Stable Diffusion Image Captioning

上記の記事では、昨日、一昨日と WD14Tagger を試しています。本日は、以前試した DeepDanbooru と比較してみます。また、DeepDanbooru の出力は以下の記事で試しています。昨日の段階では全然気づきませんでしたが、横に並べてみると WD14Tagger の情報…

#Stable Diffusion #Image Captioning #kohya_ss #DeepDanbooru #ずんだもん

2024-08-27

kohya-ss 産 WD14Tagger の出力結果をいつものようにまとめました

Stable Diffusion Image Captioning

zako-lab929.hatenablog.com 昨日の記事にて kohya-ss 産の WD14Tagger を Google Colab で使用しました。本日はいつものように画像と出力タグを一覧化します。今までにない特徴としては出力結果に「zundamon」が含まれていることですかね

#Stable Diffusion #Image Captioning #kohya_ss #ずんだもん

2024-08-26

Google Colab で kohya-ss 産 WD14Tagger 使ってみたよ

Stable Diffusion Image Captioning

zako-lab929.hatenablog.com こちらの記事で調べてた内容です。結局 kohya-ss/sd-scripts 産の WD14Tagger を使うことができました

#Stable Diffusion #Image Captioning #kohya_ss #ずんだもん

2024-08-21

wd14-tagger のタグ付けについて調べたこと

Stable Diffusion Image Captioning

kohya-ss/sd-scripts の自動キャプショニングの項目を調べていて、 DeepDanbooru のほかに WD14Tagger というものがあることがわかっています。しかも WD14Tagger のほうが精度が良いかもしれないという記載もあります。この記事では WD14Tagger を使う…

#Stable Diffusion #Image Captioning #kohya_ss #Stable Diffusion WebUI

2024-08-16

ずんだもんの DeepDanbooru によるタグ付け結果と学習用データセット内のキャプションを比較してみる

Image Captioning

DeepDanbooru によるタグ付け結果とは以下で出力した結果のことです。 zako-lab929.hatenablog.com 学習用データセット内のキャプションとは、以下の東北ずん子・ずんだもんプロジェクト公式のデータセットです。 zunko.jp いざ！比較！

#DeepDanbooru #Image Captioning #ずんだもん

2024-08-09

DeepDanbooru のタグ付け結果を確認する

Image Captioning

zako-lab929.hatenablog.com 昨日、上記の記事にて DeepDanbooru を使ってみました。作業時間が取れず、実行したところで終わっていますが、本日は、出力結果を確認していきます

#DeepDanbooru #Image Captioning #ずんだもん

2024-08-08

DeepDanbooru とやらを使ってみる

Image Captioning

DeepDanbooru はタグ付けを行ってくれるツールのようです。 DeepDanbooru is anime-style girl image tag estimation system. DeepDanbooru はアニメ風の女の子画像画像タグ推定システムとのことです。

#Google Colab #DeepDanbooru #Image Captioning #ずんだもん

2024-08-06

Image Captioning まとめ！

Image Captioning

Image Captioning に使ったモデルとその出力結果を一覧化してみました

#UniDiffuser #BLIP #BLIP2 #Transformer #Diffusers #ずんだもん

2024-08-05

BLIP-2 でずんだもんのキャプションを出力してもらった

Diffusers Image Captioning

さてさて、 BLIP , UniDiffuser で自動キャプショニング(Image captioning, Image-toText) を実施しましたが、ここ数日は BLIP-2 を調べていました。本日は BLIP-2 でのずんだもんのキャプションを出力してみます。

#Hugging Face #Transformers #BLIP2 #自動キャプショニング #Image Captioning #ずんだもん

2024-08-02

BLIP-2 で Visual Question Answering を試してみる

Diffusers Image Captioning

zako-lab929.hatenablog.com 前回、 BLIP-2 で Image Captioning (自動キャプショニング) を試してみました。本日は、 Visual Question Answering (VQA) を試してみようと思います。

#Hugging Face #Transformers #BLIP2 #自動キャプショニング #Image Captioning #VQA

2024-08-01

BLIP-2 を Google Colab で試してみる

Diffusers Image Captioning

自作 LoRA を調べていて kohya-ss/sd-scripts の README から知った自動キャプショニングの BLIP 。そして、 BLIP を調べていたら BLIP-2 もあることを知りました。今回は BLIP-2 を Google Colab で試してみます！ BLIP-2 がどういったものかは説明を読…

#Hugging Face #Transformers #BLIP2 #自動キャプショニング

2024-07-31

ずんだもんの画像データで UniDiffuser の Image-to-Text を試してみる

Diffusers Image Captioning

zako-lab929.hatenablog.com 昨日 BLIP というもので自動キャプショニングを試してみました。これは Image から Text 出力する Image-to-Text の類だと思いますので、かなり前にやった UniDiffser の Image-to-Text でやったらどうなるのか？というのが気…