Microsoftは生成AI分野での勢いを緩めていない。 ChatGPT ベースの Bing Chat を発表してからわずか 1 か月で、同社はブラウザでテキストから画像への生成を直接可能にする Bing Image Creator を発表しました。
Bing Image Creator を使用すると、OpenAI 独自のテキストから画像への AI モデルである DALL-E を使用してテキストから画像を作成できます。 Microsoft は、DALL-E の「高度な」バージョンを使用していると述べていますが、同社は 現在の DALL-E 2 モデル とどのように異なるかについては詳細を明らかにしていません。ただし、これは、新モデルが発表される前から GPT-4 上で動作してい た Bing Chat の発表方法と似ています。
Microsoft は Image Creator を使用して、画像作成を Bing Chat 自体に直接統合しています。 「画像を描画する」や「画像を作成する」などのプロンプトと、場所やアクティビティなどの説明やコンテキスト情報を使用して、Bing Chat はプロンプトに一致する一連の画像を生成するようになりました。アート スタイルの 1 つを選択する機能もあります。 Microsoft はこれを「創造的な副操縦士」と呼び、「ニュースレターのビジュアルを作成する」、「リビング ルームを模様替えするためのインスピレーションを得る」などの例を示しています。
Bing Image Creator は、Bing Chat のより実験的で想像力豊かなモードである Bing Chat のクリエイティブ モードでのみ公開されます。 Bing Image Creator も、最終的には安全な Balanced モードと Precise モードを間もなく導入する予定です。
Microsoft は、 Bing Chat の初期リリースによるより憂慮すべき結果を 回避するために、段階的に展開していると述べています。特に Microsoft は、Bing Image Creator がマルチターン チャットを処理する方法に対して行われている「継続的な最適化」を呼びかけました。
Microsoftはプレスリリースで、「これらのテクノロジーを市場に投入する最善の方法は、誰もがフィードバックできるオープンな環境で慎重にテストすることだと信じ続けている」と述べた。
Bing Image Creator は、まずモバイルとデスクトップの両方で Bing プレビューで利用可能になります。アドレス バーの右側にある Bing アイコンをクリックして、Edge ブラウザーでサイドバーを開くだけです。 Edge ブラウザーの Bing Chat (bing.com/create) から直接アクセスすることもできます。
最初は英語のみで提供されるが、Microsoft によれば、時間の経過とともにさらに多くの言語が追加される予定だという。
Microsoft は、Bing Image Creator と並んで、いくつかの新しい方法で AI を実装する、Bing のより伝統的な検索ページのアップデートも発表しました。ストーリーとナレッジ カード 2.0 はどちらも、特定の検索で表示される新しいビジュアル ウィジェットです。ストーリーは、検索の視覚的な概要であり、クリックスルーできる追加のトピック、画像、短いビデオ、グラフ、タイムラインなどを提供します。
Knowledge Cards 2.0 は、古い Bing カードの更新バージョンであり、「AI を活用したインフォグラフィックにインスピレーションを得たエクスペリエンスで、楽しい事実や重要な情報が一目でわかる」機能を備えています。 Microsoft によれば、その目標は、より没入感のあるエクスペリエンスを実現することです。
特に生成 AI に新たな重点が置かれている中で、Microsoft が Bing 自体の改善に重点を置いているのは嬉しいことです。