AI 画像生成の人気が急上昇しているため、多くの人が、DALL-E 2 を使用して自分のコンピューター上で AI 画像を生成する方法など、AI 画像生成を簡単に行う方法を探しています。 DALL-E (はい、WALL-E とサルバドール ダリにちなんで命名されました) とその後継の DALL-E 2 は、 ChatGPT の作成者である OpenAI によって開発された、独自の AI 画像生成ブランドをインターネットにもたらしました。ただし、ソフトウェアへのアクセスは厳しく制限されています。
この状況は 2022 年の夏に限定公開ベータ版で変わり、 その数か月後に誰でも試せる 完全ベータ版リリースで変わりました。 Microsoft の Bing Image Creator の 一部として無料で試すこともでき、 Bing Chat に完全に統合されます。
ダルイー2の使い方
ステップ 1: OpenAI にログインします 。初めての場合は、サインインするためにアカウントを作成する必要がありますが、完全に無料です。時間を節約したい場合は、Google または Microsoft 経由でサインインするオプションもあります。 OpenAI では 2 要素認証が必要となるため、開始するときに携帯電話を手元に用意してください。

ステップ 2: サインアップが完了すると、Open AI によって DALL-E 2 が紹介されます。 [続行] を選択して AI の使用を開始します。次に、OpenAI がそのクレジット プロセス、つまり DALL-E 2 を長期にわたってどのように使用できるようになるかについて説明します。
初めてサインアップすると、最初の 1 か月間お試しいただける 50 クレジットが無料で付与されます。その後毎月、使用できる追加の 15 クレジットが付与されます。各クレジットは、イメージの生成などの 1 つの DALL-E 2 リクエストを表すため、取得できる試行回数がわかります。 OpenAI のストアでいつでも追加のクレジットを購入できます。15 ドルで 115 クレジットを使用できます。

ステップ 3: DALL-E 2 のホーム画面には、開始するためのいくつかの異なるオプションが表示されます。独自の説明を入力したり、AI が指示に基づいて編集できるように画像をアップロードしたり、 [Surprise me] を選択すると、AI とうまく連携するように設計された説明が自動生成されます。クレジット数には限りがあるため、慎重に計画してください。ここでは、特定の結果を得るために説明を入力すると仮定します。

ステップ 4: 説明を入力します。使用文字数は 400 文字なので、時間をかけて具体的に入力してください。 DALL-E 2 は芸術的なイメージと相性が良いので、試してみたい絵画、ステンドグラス、デジタル アート、またはその他の特定の媒体を遠慮なく尋ねてください。準備ができたら、 「生成」 を選択します。

ステップ 5: リクエストごとに、DALL-E 2 は選択できるいくつかの異なるイメージを生成します。気に入ったものを見つけて、右上隅にあるボタンを使用して、後で見るためにお気に入りにするか、今すぐダウンロードします。
ステップ 6: 画像が希望どおりでない場合は、 [バリエーション] を選択してみてください。これにより、選択した画像に基づいて新しい選択範囲が生成されます。または、戻ってフレーズを微調整して別の結果を得ることができます。

ステップ 7: 場合によっては、1 つまたは 2 つの異なる単語を変更するか、別の媒体を指定するだけで、大きな違いが生じることがあります。どのようなイメージを望むかを再考し、必要に応じて何か新しいものを試してください。結果は予想外になる可能性がありますが、それは楽しみの半分です。

DALL-E 2 を使用するためのヒント
学校の課題やアート プロジェクトなどで DALL-E 2 の使用を真剣に検討している場合は、最初に DALL-E 2 の最適な使用方法を学び、結果としてクレジットの費用を節約することをお勧めします。幸いなことに、 Guy Parsons の Dallery Gallery ブログには、新規ユーザー向けに 2022 年にリリースされる優れたガイドがすでに公開されてい ます。 80 枚以上のスライドがあり少し長いですが、基本を一通り説明するので、必要な種類の AI 画像を生成する準備が整います。いくつかの重要なヒントは次のとおりです。
-
プロンプトは長くする必要はなく、ほんの数語でもかまいません。さらに興味深いことに、これらは一連の絵文字にすることもでき、DALL-E 2 は可能な限り正確に解釈しようとします (つまり、ナスの絵文字は実際のナスの写真になります)。
-
DALL-E 2 が芸術的な志向を持っていると述べたとき、それは AI が多くの芸術を処理したことを意味します。つまり、特定のトリックによって興味深い結果が得られる可能性があります。特定の種類のアートに言及すると、DALL-E 2 は「シュルレアリスム」など、そのスタイルが流行していた時代からインスピレーションを受けることになります。他の例には、ディーゼルパンク、ポスト黙示録的、サイバーパンクなどがあります。または、すぐにスキップして、説明に「1950 年代」などを追加して、特定の時代を取得することもできます。
-
DALL-E 2 は写真にも詳しいです。写真家は、DALL-E 2 がどのように反応するかを確認するために、特定のビュー、角度、距離、照明、撮影テクニック (またはレンズ) を躊躇なく含めるべきです。
-
権利を持たないプロンプト写真をアップロードして使用することは、技術的には DALL-E 2 のポリシーに違反します。 DALL-E 2 が特定の画家や写真家などの他の作品を多数処理している場合は、説明に名前を含めることで、それらからインスピレーションを得た作品を作成できる可能性があります。それは人気の漫画や映画など、あらゆる種類の固有名詞に及びます。
-
通常、AI ジェネレーターは、非常に具体的なプロンプトがない限り、 顔の扱いに苦労します 。画像内の顔が奇妙すぎる場合は、もう一度試して、どのような表情をしたいか、顔がどこを見ているのかなど、顔の追加の説明を追加できます。
-
画像をアップロードする場合、特定の被写体を切り取って新しい設定に配置したり、画像から不要なオブジェクトを削除して再作成したりするなど、カットアンドペーストでさまざまなことができます。