Midjourney v5 は、リアルな作品で知られる人気のテキストから画像へのジェネレーターの最新言語モデルです。
この アップデートは水曜日にMidjourneyの有料顧客ベースに公開され 、グラフィックデザイナーのJulie Wielandを含む多くのユーザーがAIが生成した新しいアートワークを共有している。 v5 言語モデルによってもたらされる AI の詳細には、「効率、一貫性、品質」の向上が含まれると Midjourney は Web サイトで 述べています。
多くのユーザーは特に人間の手の詳細のアップグレードに注目しており、被験者は片手に 5 本の指を持っている可能性が高くなります。以前のモデルでは、人間の手が 4 桁から 7 ~ 10 桁の間の誤った桁数で生成されることがよくありました。 Midjourney v5 をテストできた人は、ビジュアルのアップグレードに感銘を受けたでしょう。
「最新の Midjourney v5 モデルは、非常に圧倒的で恐ろしいと同時に、魅力を超えています」と Wieland 氏は PetaPixel に語った。
「リアルな肌の質感や顔の特徴、照明など、複雑な詳細や質感を再現する能力は比類のないものです」と彼女は付け加えました。
Midjourney はやや独特な言語モデルですが、 Stable Diffusion や DALL-E などの他のテキストから画像へのジェネレーターと同様の方法で機能し、人間を使用してトレーニングされたモデルに従って、言葉によるプロンプト記述子を使用して画像を作成します。 ArsTechnica によると、参考としてアートを作成しました。
AI によって生成されたアートが合法なのか倫理的なのかについては、議論が続いています。ただし、Midjourney v5 ユーザーの多くは、アップグレードを続けると本物のアートや写真と区別がつかなくなる可能性があると考えています。ウィーランド氏は、Midjourney のような AI 画像ジェネレーターは、写真家の代替品ではなく、相棒になる可能性が高いと考えています。
ただし、Midjourney v5 にも問題がないわけではありません。 AI 画像クリエイターの Nick St. Pierre は、以前の Midjourney v4 と Midjourney v5 で同じプロンプトを使用し、多くの作品を共有しました。 1 枚の画像は、1960 年代のストリート スタイルを着た若い女性の魅力的なショットで、アウトドア ファッション撮影に似ていました。よく観察すると、背景に体に取り付けられていない浮遊の手と歪んだ顔が見えます。
最新の v5 モデルでは、Midjourney の創設者 David Holz 氏がブランドの Discord で、ユーザーが短いプロンプトを避け、より良い結果を得るために「より長く、より明示的なテキスト」を選択するよう推奨しました。

