日本語も対応した文章から画像をAIが生成するWebサービス 『Stable Diffusion』

続々と文章からAIが画像生成するWebサービスが
出てきていますが、
こちらは日本語も認識してくれます。
オープンソースで無料で利用可能なようです。

目次

リンク先

Stable Diffusion Demo リンク先はこちらから

使い方

使い方は簡単で「Enter your prompt」と書かれたテキストボックスに
描きたいモノを文章で入力します。
英語でも日本語でも認識は可能なようですが、
英語の方が出力された結果が近いようです。

まずは簡単に「fish」と入力してみました。
文章を入力したら「Generate image」ボタンをクリックします。
数分で出力されました。
ちゃんとした図鑑とかで見るような魚が出力されました。

画面右上にqueueという数値が出てきます。
queueは待ち人数みたいな数値でこちらが多い方が出力に時間が掛かります。
速い時はすぐに処理されて数秒で表示されますが、
平均数分(1~2分ぐらい)掛かります。

今度は日本語で入力してみました。
「東京でラーメンを食べる」と何となくイメージが湧きそうな
文章の出力結果がこちらです。
あんまり東京は関係ないような感じです。笑

「スカイツリーを見ながらアイスを食べる」と入力してみました。
スカイツリーの要素が全くないのですが、
見たことないタケノコの様なアイスが出てきました。笑

「スカイツリーを眺める男」と入力してみました。
誰の視点で描かれているのだろうか。。笑
近いような遠いような感じで、日本語でも
認識は可能なようですが、精度は低いようです。

「絶景を眺める女性」と英語で入力してみました。
かなりイメージと近い感じで、日本語よりも精度は高いようです。
しかしAIの精度、認識率ってすごい高くなりましたね。

「廃墟で人間を襲う恐ろしいモンスター」と英語で入力してみました。
ゲームの世界のクオリティーです。しかも背景には廃墟らしきモノも
描かれています。

出力された画像の下には「Advanced options」という項目があり
AIの出力を調整出来るようです。
SeedやGuidance scaleなど細かく数値が設定可能で
色々と試してみると面白いと思います。

レビュー

サンプルの出力結果がページ下部のリンクから見る事ができます。
すごいクオリティーで映画の世界のようです。
日本語でも認識はしてくれますが、精度は甘いので
英語の方がよさそうです。
この記事の為に何回も作ってみましたが、
回数制限などはないようです。
使用に関しては画面下部からライセンス項目も記載されているので
ご使用の際は確認しておく必要があります。
AIの今後の発展が楽しみになるWebサービスです。

よかったらシェアしてください!
  • URLをコピーしました!

コメント

コメントする

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください

目次