2023 年に決定的な流行語があるとすれば、それは「生成人工知能」でなければなりません。
OpenAI のチャットボット ChatGPT への関心の爆発的な高まりにより、数百万人が初めて生成 AI ツールを使用し始める 1 年間の準備が整いました。
記事全体や試験問題は単純なテキスト プロンプトで生成できますが、テキスト プロンプトを使用して画像を生成することもできます。ユーザーがほんの数語を入力するだけで、アートワーク、ポスター、ロゴ、プレゼンテーション、フォトリアリスティックな画像を作成できるプラットフォームが数多く登場しています。
機械学習のおかげでこれが可能になります。ニューラル ネットワークは大規模なデータセットでトレーニングされ、画像内のパターンと特徴を識別する方法を学習します。次に、アルゴリズムはこの学習した知識を使用して、テキスト プロンプトが何を探しているのかを予測します。
現在利用可能な最も人気のある画像生成ツールのいくつかを見ていきます。プラットフォームに飛び込み使用する前に、AI によって生成された画像に関する著作権の状況に注意を払う価値があります。すでに多くの訴訟が進行中で、アーティストらは、著作権で保護された素材に基づいてトレーニングされたと主張するAIプラットフォームを所有する企業に対して損害賠償を請求している。
現在利用可能な最高の画像ジェネレーター 5 つを見てみましょう。
旅の途中
プロンプト:「呪文を唱えるパワーメイジ」
最初に大ヒットした AI 画像ジェネレーターの 1 つである Midjourney は、ユーザーがその機能に驚き、無料トライアルに魅了されたため、何百万ものユーザーをそのプラットフォームに引き付けました。
その無料トライアルはもう存在しないため、自分で試すには今すぐサブスクリプションの料金を支払う必要があります。価格は月額 8 ドル (9.33 ユーロ) からです。
スタンドアロンのプラットフォームではなく Discord を通じて機能するため、このプロセスは面倒な場合があります。試行錯誤するか、オンラインで利用できる多数のプロンプト ガイドからレッスンを受けることで、写真のようにリアルな画像、アート、漫画、またはスケッチを思いのままに作成できる Midjourney がいかに強力であるかがすぐにわかります。
すでに 1,500 万人以上のユーザーがいるのも不思議ではありません。
プロンプト: "フィンセント・ファン・ゴッホのスタイルで、夕暮れ時に離陸する飛行機の絵。」
大人気の ChatGPT を開発した OpenAI の DALL·E 2 も、人気のある画像作成ツールです。
ユーザーは無料プランで多数の画像を生成できますが、一括して生成するには有料プランにサインアップする必要があります。このプラットフォームは数百万人のユーザーを誇りますが、フォトリアリスティックなスタイルの画像では Midjourney ほどうまく機能しないようです。優れているのはアートワークであり、有名な画家のスタイルを模倣するコツを備えています。
OpenAI の GPT-4 が Microsoft Bing 検索エンジンの AI チャットボットを強化しているのと同じように、DALL·E 2 も Bing の画像生成ツールを強化しています。
DreamStudio (安定拡散)
プロンプト:「素朴な木のテーブルの上に湯気が立つマグカップ。背景の窓から木々が見えます。」
初期の大物モデルのもう 1 つである Stable Diffusion は、人気のある画像生成モデルであり、Web ブラウザー上に無料ツールが備わっています。 DreamStudio は安定拡散モデルを使用しており、多数のオプションとプロフェッショナルなユーザー インターフェイスを備えています。
サインアップすると、一定量の無料クレジットが付与されますが、その後、追加するには料金を支払う必要があります。結果は、特に人間の顔を生成する場合に印象的です。ただし、これらすべての画像ジェネレーターと同様に、人間の手に関しては特に問題があるようです。
ドリーム・バイ・ウォンボ
プロンプト:「エイリアンの宇宙ステーション」
他のプラットフォームと同様、アート生成を目的としており、単純なテキスト プロンプトを入力するだけで、アルゴリズムによって思い描かれた画像が配信されます。名前が示すように、生成される画像はどこか夢のようで、抽象的で、しばしば不気味な結果が得られます。
数十のアート スタイル (「バッド トリップ」や「スチーム パンク」など) から選択できるこの場所は、まさにアート創作の遊び場です。 Web アプリとモバイル アプリとして利用できます。
カンバ
プロンプト:「エッフェル塔を背景にスーパーカーを運転して道路を走る男性。」
ソーシャル メディアの投稿やプレゼンテーションの作成に主に使用されている人気のグラフィック デザイン プラットフォームが、両足で生成 AI に参入しました。
前述のメディア タイプを生成する機能が本当に優れているため、これを特別な言及として含めています。無料の画像作成 AI も備えていますが、現時点ではおそらく少し洗練されていません。
作成する画像の種類については非常に厳密なルールがあります。
たとえば、シャンゼリゼ通りでフェラーリを運転するエマニュエル・マクロン氏の描写が拒否されたため、代わりに「エッフェル塔を背景に道路をスーパーカーで運転する男性」で妥協しなければなりませんでした。
まだ作業中の段階のようです。