「画像生成AI」はどんな種類や違いがある？「Midjourney」「DALL」「Stable Diffusion」などを比較 [インターネットサービス] All About

テキストからイラストや画像を作成する「画像生成AI」が話題に

「画像生成AI」が話題に

AIにテキストを入力するだけで誰でもすぐにイラストが作成できる。そのような画像生成AIの一般化が進んでおり、今後「イラストレーターは必要なくなるのでは？」とも言われています。「Midjourney」「DALL・E2」「Stable Diffusion」など、各画像生成AIの概要や違いについて解説します。

＜目次＞

Midjourney

「日本の夕暮れ」とテキスト入力して作成

Midjourneyは、単語、文章を問わず、描いて欲しい絵のイメージやキーワードを入力すると、それに沿った画像をAIが作成してくれるサービスです。「Discord」というチャットサービス上で動くツールで、利用するにはDiscordのアカウント登録が必要となります。

テキストは日本語に対応していますが、英語を入力した方がより高品質のイラストが作成されます。
有料プランは、月額10ドルで月200枚まで、月額30ドルで枚数無制限のプランがあります。有料プランのみイラストの商業利用が可能となります。

DALL・E2

フェルメールの有名な作品「真珠の耳飾りの少女」にAIが背景を描き足したもの

DALL・E2は、研究者・専門家向けに提供が始まった画像生成・編集AIです。利用するには、順番待ちリストに登録する必要があります。

1回の使用で3～4枚の画像が生成されますが、1回の使用ごとに1クレジットが必要になります。このクレジットは、15ドルで115クレジットを購入できます。

DALL・E2の特徴として、画像を新規に生成するだけでなく、既存の画像を編集する機能が実装されている点です。例えば、フェルメールの有名な作品である「真珠の耳飾りの少女」には背景がありませんが、これにAIが背景を描き足すというものです。

Stable Diffusion

「an insect robot preparing a delicious meal」（おいしい食事を用意する昆虫ロボット）というテキストをもとにした画像

Stable Diffusionでも同様にユーザーがテキストでキーワードを指定すると、それに応じた画像が自動生成されます。Stable Diffusionにはアカウント作成や登録をすることなく利用できるデモバージョンが用意されています。

DALL・E2などと異なり、Stable Diffusionはオープンソースであるため、生成する画像を人為的に制限していません。

こちらの画像は「an insect robot preparing a delicious meal」（おいしい食事を用意する昆虫ロボット）というテキストをもとにした画像です。

AIピカソ

「巨内な怪獣。ビジネス街を破壊している」とテキスト入力して作成

日本語入力対応のスマホアプリです。画像生成の回数制限がない点が特徴。iOS版のみの提供ですが、Android版も後日リリースされる予定です。画像生成のAIには「Stable Diffusion」のものを利用しています。ダウンロードはこちら

欲しい画像のイメージをテキストや文章で入力し、数十秒待つと画像が作成されます。また、テキストとともに、「reference Image」欄に画像を参照として入力することで、よりイメージに近い画像が作成されます。描いたラフ画をAIがイラストに仕上げてくれる機能も搭載されています。

試しに作成してみた

上記のAIはどれも、テキストによって作成される画像を非常に細かく指定できることを特徴としています。

watercolor painting （水彩画）
photograph（写真）
pencil sketch（鉛筆画）

などの絵・画像の種類を指定するテキスト、

ancient（古代風の）
futuristic（未来的な）
realistic（リアルな）

などの絵のトーンを指定するテキスト、

by Vincent van Gogh（ゴッホ風）
in ukiyo-e style（浮世絵風）
in Studio Ghibli style（ジブリ風）

などの画風を指定するテキストを入力することで、より意図に近い画像を作成できるようになります。

試しにMidjourneyで「cats,watercolor painting,by Vincent van Gogh」（猫、水彩画、ゴッホ風）とテキストを入力してこちらの画像を作成しました。

Midjourneyで「cats,watercolor painting,by Vincent van Gog」（猫、水彩画、ゴッホ風）とテキストを入力して作成した画像

Midjourneyで「cats,watercolor painting,by Vincent van Gogh」（猫、水彩画、ゴッホ風）とテキストを入力して作成した画像

画像生成AIの使い道

画像生成AIには、さまざまな用途が考えられます。「いらすとや」に代表されるフリー素材の代替となることが考えられますし、アートやクリエイティブの分野に補助的に組み込まれることも考えられます。

例えばMidjourneyは、すでにゲーム業界での背景制作や素材製作に利用されるなど、実用ツールとして活用され始めています。その低いコストによって、アマチュアのクリエイターが作品にこれらのAIによるイラストを導入していくという用途もまた考えられます。

【関連記事】

※記事内容は執筆時点のものです。最新の内容をご確認ください。

※OSやアプリ、ソフトのバージョンによっては画面表示、操作方法が異なる可能性があります。