Samsung Galaxy S24 の AI 機能に興奮しすぎないでください

 Samsung Galaxy S24 の AI 機能に興奮しすぎないでください
黄色の Samsung Galaxy S24 のレンダリング。

「モバイルAIの新時代」。これが、Samsung が Galaxy S24 シリーズ の今後のスマートフォンを宣伝する方法です。今月後半に開催される Unpacked イベントで、同社は「AI を活用したまったく新しいモバイル エクスペリエンス」を約束しています。

ChatGPT Midjourney などによって引き起こされた AI の誇大宣伝に足を踏み入れるのは、Samsung が最初ではないでしょう。スマートフォン シリコンの大手 2 社、クアルコムとメディアテックは最近、最新のフラッグシップおよびミッドレンジ プロセッサのオンデバイス生成 AI 機能について大規模なショーを行いました。

変化は明らかです。 AI は携帯電話のマーケティングのバズワードになるでしょう。しかし、私たちは一体何のためにいるのでしょうか?これらのいわゆる「AI の進歩」がどのように有意義な価値を付加するのかはまだ秘密のままです。あるいは、別の名前またはネイティブ アプリで再パッケージ化されるのを待っている既存のトリックかもしれません。

サムスンは成果を上げるか、それとも見事に失速するか

Samsung による Galaxy AI のティーザー。

Galaxy S24シリーズの携帯電話から始めましょう。 クアルコムのSnapdragon 8 Gen 3チップ を搭載して出荷される予定です。チップメーカーは、新しい最上位チップセットの生成 AI 機能について大胆な主張を行っています。たとえば、 Stable Diffusion AI 技術 を使用して、テキスト プロンプトから画像を 1 秒以内に生成すると言われています。

クアルコムは、安定拡散技術をデバイス上の動作にどのように最適化したかについて、興味深い技術的な 説明 を提供しました。ライバルの MediaTek も、同社の主力製品である Dimensity 9300 のオンデバイス AI チョップにより、Stable Diffusion のおかげで 2 秒以内にテキストから画像への生成が可能になると主張しています。

現在、私たちはすでにクアルコムの最新フラッグシップを搭載した携帯電話を持っています。問題のデバイスは iQoo 12 ですが、この携帯電話のマーケティング資料には、特に Qualcomm や MediaTek によって宣伝されている種類の生成 AI トリックについてはまったく言及されていないのは興味深いことです。

AI が生成したこれらの忍者猫の写真はどうすればよいでしょうか?

サムスンがそのテキストから画像への生成機能を提供する運命にあると仮定しましょう。結局のところ、それは何を達成するのでしょうか?現時点では、テキストから画像へのトリックがサードパーティのアプリ内にバンドルされるのか、それともサムスンが自社アプリの 1 つに統合するのかはわかりません。

本当の問題は、それが私たちの日常的なスマートフォンの使用パターンにどれだけの価値をもたらすかということです。平均的な Galaxy S24 購入者は、たった 1 行のテキスト プロンプトで生成された画像をどうするでしょうか?おそらく、AI が生成した画像を使用して、チャットに活気を与えたり、ソーシャル メディアで話題にしたりするでしょう。

しかし、ここにはまだ摩擦があります。これらの画像をテキスト行から生成し、ローカルに保存 (または直接クリップボードにコピー) して、それらの AI 画像を選択したチャット アプリに貼り付ける必要があります。最も最適な解決策は、サムスンが何らかの方法で画像からテキストへの生成トリックをキーボードに直接統合することだろう。

Qualcomm の携帯電話向け Stable Diffusion デモ。

もう一度言いますが、絵文字、GIF、ステッカーで十分な機能があるのに、なぜわざわざ苦労する必要があるのでしょうか?また、512 x 512 ピクセルの出力は、これらの AI 生成画像を大学の課題や仕事のプレゼンテーションに使用するには十分な解像度ではありません。

さらに、このシステムはおそらく無料ではないでしょう。 MediaTek のデモビデオでは、プレミアムオプションが検討中であると述べられています。 Galaxy S24 の購入者は、特定の出力数に達すると、テキストから画像へのトークンの制限に遭遇する可能性があり、その後は、より遅い画像生成速度層にダウングレードされるか、サブスクリプション料金の支払いを求められます。

しかし、それが現実だとすれば、 OpenAI の Dall-E のようなソリューションがすでに存在しているため、その点はまったく意味がありません。無料で画像を生成するために入手することも、 ChatGPT Plus を 有料で入手して、最新の Dall-E 3 モデルでより高速かつ詳細な画像生成の特典を楽しむこともできます。これは、世の中にたくさんあるテキストから画像へのジェネレーターの 1 つにすぎません。

クアルコムは、Snapdragon 8 Gen 3 が「マルチモーダル Gen AI モデルを初めてサポートする」と述べています。つまり、電話機上でネイティブに実行されるチャットボット (Meta の Llama モデルに基づく) は、音声だけでなくテキストや画像の形式で入力を受け入れることになります。繰り返しになりますが、サブスクリプションの壁の背後にあるとはいえ、ChatGPT-4 はすでにその機能を提供しているため、これは特別なことではありません。

本当に必要ですか?

携帯電話のSnapdragon AIアシスタント。

クアルコムが宣伝する最も有望な機能の 1 つは、AI 画像拡張です。基本的に、画像のキャンバスを任意の方向に拡張でき、デバイス上の生成 AI がテキスト プロンプトに基づいてピクセルをインテリジェントに生成し、元のフレームにオブジェクトを追加します。

このトリックを目撃するのは驚くべきことです。あたかも巨匠の画家が自分の作品に手を加えているかのように、イメージがオブジェクトの追加によって拡大し、視野が広がるのを見るのです。しかし、携帯電話上でクリックして思い出として保存した写真に対してはそうしたくないでしょう。これらに対して生成 AI 拡張を使用することは、実際には経験したことのない偽のビジュアルやシナリオで記憶を汚すようなものです。

要約は、携帯電話でのオンデバイス生成 AI の展開におけるもう 1 つの大きな賭けです。ニュースを読んだり、さまざまな分野の最新の動向を把握したりするのに最適です。ただし、このトリックは摩擦が最小限の場合にのみ顕著になります。たとえば、ユーザーが別のアプリを開かずに、同じブラウザ ページでニュース記事を要約できる場合です。

後者の場合は、すでにそれを実行しているアプリに移行すればよいのではないでしょうか?たとえば、 Artifact は、Instagram の共同創設者である Kevin Systrom が開発した、AI を使用して記事を要約する驚くほどデザインされたアプリです

Inshorts など、要約されたナゲットの形式でニュースを提供するアプリや Web サイトはすでに存在します。受信トレイにとって、 Shortwave は、追加料金なしで電子メール チェーンを要約するだけでなく、それ以上のことを行うことができる優れたアプリです

Shortwave での電子メールの概要の送信

オンデバイスの生成 AI は、音声ベースの写真編集などの技術も期待されています。驚くほど便利に聞こえますが、ワンタップのフィルターと詳細なスライダーが同様に迅速で価値のあるフローを携帯電話でメディア編集できるようになると、私たちの生活にどれだけ便利さが加わるか想像するのは困難です。

次に、一般的なチャットを開始したり、インターネットを活用した調査が必要となる回答を得るために AI を使用するという基本的な状況に移りましょう。ここでも質的な問題に直面することになります。

Meta の Llama など、携帯電話上でネイティブに実行される生成 AI モデルは、リソースが基本的に利用可能であるため、この種のモデルの中で最も先進的なものではありません。 Google 以外に探す必要はありません。 Pixel 8 Pro は、Gemini Nano と呼ばれる Google の大規模言語モデルの中で最も小さいモデルのみを実行します 。機能の低い言語モデルに妥協するのではなく 、専用のモバイル アプリを介して ChatGPT や Pi など にジャンプしてみてはいかがでしょうか?

生成 AI が本当に必要とされる場所

AI アシスタントと ChatGPT の比較。

現時点で、生成 AI が最善の策を講じていると私が見ているのは、スマートフォンのタスクをクラウドから切り離し (そして常にオンラインである必要がある)、追加の安全性を提供することです。しかし、そのためには、これらのデバイス上の AI トリックが、Google アシスタント、Alexa、または Siri のようなアシスタントとしても機能する必要があります。

あるいは、さらに良いことに、彼らはアシスタントの一部になる必要があります。生成 AI アシスタントに、ライブラリからすべての猫の画像を選択し、コラージュに織り込んで、お父さんに送信するように指示します。あるいは、ディズニーランドへの日帰り旅行に最適な旅程を計画し、次の週末の最安チケットを見つけて、それらすべての詳細を Google カレンダーにきちんと整理するように依頼することもできます。

さらに、オンデバイスの生成 AI ツールがデータをクラウド サーバーにプッシュせず、すべての操作をスマートフォンのローカルに保つようになれば、データ プライバシーについて心配する必要はほとんどなくなります。少なくとも理論的にはそうです。今のところ、Samsung が販売している Galaxy AI ビジョンについてはわかりませんが、Samsung が本当に有意義な生成 AI エクスペリエンスを提供できるのか、それとも実用的かぎりぎりのギミックの数々を提供できるのかを見るのは興味深いでしょう。

「 Samsung Galaxy S24 の AI 機能に興奮しすぎないでください」についての動画選定!

Galaxy S24シリーズのスペックや価格は?AI機能がスゴすぎる!
【ついに】熟成進化でiPhoneを超えた Galaxy S24 Ultra。次世代画面と動画が最強すぎ!