テキストからイラストや画像を作成する「画像生成AI」が話題に
「画像生成AI」が話題に
Midjourney
Midjourneyは、単語、文章を問わず、描いて欲しい絵のイメージやキーワードを入力すると、それに沿った画像をAIが作成してくれるサービスです。「Discord」というチャットサービス上で動くツールで、利用するにはDiscordのアカウント登録が必要となります。テキストは日本語に対応していますが、英語を入力した方がより高品質のイラストが作成されます。
有料プランは、月額10ドルで月200枚まで、月額30ドルで枚数無制限のプランがあります。有料プランのみイラストの商業利用が可能となります。
DALL・E2
DALL・E2は、研究者・専門家向けに提供が始まった画像生成・編集AIです。利用するには、順番待ちリストに登録する必要があります。1回の使用で3~4枚の画像が生成されますが、1回の使用ごとに1クレジットが必要になります。このクレジットは、15ドルで115クレジットを購入できます。
DALL・E2の特徴として、画像を新規に生成するだけでなく、既存の画像を編集する機能が実装されている点です。例えば、フェルメールの有名な作品である「真珠の耳飾りの少女」には背景がありませんが、これにAIが背景を描き足すというものです。
Stable Diffusion
Stable Diffusionでも同様にユーザーがテキストでキーワードを指定すると、それに応じた画像が自動生成されます。Stable Diffusionにはアカウント作成や登録をすることなく利用できるデモバージョンが用意されています。DALL・E2などと異なり、Stable Diffusionはオープンソースであるため、生成する画像を人為的に制限していません。
こちらの画像は「an insect robot preparing a delicious meal」(おいしい食事を用意する昆虫ロボット)というテキストをもとにした画像です。
AIピカソ
日本語入力対応のスマホアプリです。画像生成の回数制限がない点が特徴。iOS版のみの提供ですが、Android版も後日リリースされる予定です。画像生成のAIには「Stable Diffusion」のものを利用しています。ダウンロードはこちら欲しい画像のイメージをテキストや文章で入力し、数十秒待つと画像が作成されます。また、テキストとともに、「reference Image」欄に画像を参照として入力することで、よりイメージに近い画像が作成されます。描いたラフ画をAIがイラストに仕上げてくれる機能も搭載されています。
試しに作成してみた
上記のAIはどれも、テキストによって作成される画像を非常に細かく指定できることを特徴としています。- watercolor painting (水彩画)
- photograph(写真)
- pencil sketch(鉛筆画)
- ancient(古代風の)
- futuristic(未来的な)
- realistic(リアルな)
- by Vincent van Gogh(ゴッホ風)
- in ukiyo-e style(浮世絵風)
- in Studio Ghibli style(ジブリ風)
試しにMidjourneyで「cats,watercolor painting,by Vincent van Gogh」(猫、水彩画、ゴッホ風)とテキストを入力して こちらの画像を作成しました。
画像生成AIの使い道
画像生成AIには、さまざまな用途が考えられます。「いらすとや」に代表されるフリー素材の代替となることが考えられますし、アートやクリエイティブの分野に補助的に組み込まれることも考えられます。例えばMidjourneyは、すでにゲーム業界での背景制作や素材製作に利用されるなど、実用ツールとして活用され始めています。その低いコストによって、アマチュアのクリエイターが作品にこれらのAIによるイラストを導入していくという用途もまた考えられます。
【関連記事】
- 画像生成AIで懸念される「トレパク」問題、時代に合わせてどう考えていくべきか
- AI画像生成の「リアルできれいな顔」を、気持ち悪く感じる理由
- Googleが発表したテキスト画像AI生成モデル「Muse」とは?