Decoder によると、OpenAI は現在一般公開されている一連のアルファ テストを備えた DALL-E AI テキスト画像ジェネレーターの次期バージョンを準備している可能性があります。
Discord 上の匿名のリーカーが、DALL-E 3 と呼ばれる次期 OpenAI イメージ モデルにアクセスした経験について詳細を共有しました。彼は 5 月に初めて現れ、興味ベースの Discord チャンネルに、自分がアルファ テストに参加したと語った。 OpenAI、新しい AI 画像モデルを試しています。彼はその時に生み出したイメージを共有した。
5 月のアルファ テスト バージョンには、画像モデル内で複数のアスペクト比の画像を生成する機能がありました。次に、YouTuber の MattVidPro AI が 、16:9 のアスペクト比で生成された画像をいくつか紹介しました。このバージョンでは、このモデルが高品質のテキスト生成に優れていることも示されました。これは、 Stable Diffusion や Midjourney などのトップ ジェネレーターであっても、ライバル モデルにとって依然として悩みの種となっています。
いくつかの例では、レンガの壁に溶け込んだ文字、言葉のネオンサイン、街の看板、ケーキのデコレーション、山に刻まれた名前などの画像が紹介されていました。このモデルは、DALL-E は人を生み出すのが得意であると主張しています。そのような画像の 1 つは、パーティーでスパゲッティを食べている女性を魚眼の視点から表示しました。
リーカーは7月中旬にさらなる詳細と新しい画像を携えてDiscordチャンネルに戻ってきた。彼は、約 400 人の被験者が含まれる「クローズド アルファ」テスト バージョンの一部であると主張しました。同氏は、電子メールでトライアルに招待され、オリジナルの DALL-E と DALL-E 2 のテストにも参加したと付け加えた。これにより、アルファ テストは DALL-E 3 用である可能性があるという結論に至りましたが、確認されていません。
5月から7月にかけてモデルが大幅にアップデートされました。リーカーは、同じプロンプトに基づいて生成された画像を共有することでこれを紹介し、DALL-E 3 が時間の経過とともにどれほど強力になったかを示しています。プロンプト には、自転車競技中にパンダにハイタッチをするピンクの道化師の絵が表示されます。自転車はチーズでできていて、地面はとてもぬかるんでいます。彼らは霧の森の中を運転しています。パンダが怒っています。
5 月のアルファ版では、プロンプトのほとんどのポイントに該当する一般的なシーンが生成されます。接続している手の部分に少し歪みがあり、自転車の車輪はチーズ製とは対照的に黄色です。ただし、7 月のアルファ版ははるかに詳細で、ピンクの道化師とパンダが明らかにハイタッチし、自転車の車輪が数世代にわたってチーズで作られています。
一方、『ミッドジャーニー』では道化師が現場から姿を消し、パンダたちは自転車ではなくバイクに乗っている。泥の代わりに道があります。パンダたちは怒るのではなく喜んでいます。
DALL-E の 7 月 3 日のアルファ イメージの例は、モデルの可能性を示しています。しかし、アルファテストは無検閲であるため、リーカーは「暴力やヌード、または会社のロゴなどの著作権で保護された素材」のシーンが生成される可能性もあると指摘した。
例としては、血みどろのアニメの女の子、 ゲーム・オブ・スローンズの キャラクター、 グランド・セフト・オートVの カバー、サブウェイのサンドイッチを食べるゾンビのジーザス(これも軽度のゴア表現を示唆している)、考古学的発掘現場から掘り出されるシュレックなどが挙げられる。
MattVidPro AI は、画像モデルが特定のスタイルであると想定されているかのように画像を生成すると指摘しました。
DALL-E 2は2022年4月に発売されましたが、その人気と倫理と安全性への懸念により、待機リストが出るなど厳しく規制されていました。 AI 画像ジェネレーターは 2022 年 9 月に 一般公開 されました。

