Apple は、 WWDC 2023 で Vision Pro 複合現実ヘッドセットを発表し、新時代を迎えました。これを次のiPhoneの瞬間と呼ぶ人もいます。それにもかかわらず、Siri(Appleのスマートフォンの初期に世界を驚かせた象徴的なiPhoneの革新技術であり、AlexaやGoogleアシスタントにその地位を奪われた)は、野心的な発表が満載だったこのカンファレンスではほとんど目立った痕跡を残さなかった。
GoogleやMicrosoftが過去数カ月間AI関連の物販を売り歩いてきたのとは異なり、AppleはSiriに輝ける機会をほとんど与えなかった。 iOS 17 と iPadOS 17 の登場により、Siri に加えられる変更は、起動コマンドの短縮と会話機能の 2 つだけです。
「Hey、Siri」と言う代わりに、ユーザーは「こんにちは」や「ねえ」を使わずにアシスタントの名前を発声するだけで、AI アシスタントがその仕事をしてくれます。次に、会話機能が追加されました。つまり、フォローアップ リクエストの最初に「Siri」または「Hey Siri」と言う必要がなく、Siri に話しかけて複数の音声プロンプトを発することができます。
AI アシスタント (10 億台を超える携帯電話、タブレット、スマートウォッチに搭載されている AI アシスタント) が、会話を進めるためのコードを解読していないのは不可解です。
Siri は AI レースにおいて怠惰に座っているアヒルです
「ねえ」の声を切り取ったり、Siri の音声をロボットっぽさをなくしたりすることは、Siri にふさわしい画期的なアップグレードではありません。 Open AI の GPT-4 や Google の LaMDA 自然言語モデルを活用した AI チャットボットが、Web 検索や研究論文の執筆から、不安や孤独を和らげる仮想パートナーとしての役割まで、あらゆるものを再考しようとしている 2023 年には決してありません。
現時点で、Siri は音声アシスタントの分野ではほとんど笑いものになっています。さらに残念なのは、Apple のショートカット アプリの使い方を知っている人にとって、Siri はおそらく最も印象的なタスク自動化スイートを提供しているという事実です。残念ながら、Apple は次の論理的なステップを踏み出して、Notes や Safari などの自社アプリの中心に Siri を組み込むつもりはありません。
たとえば、 Bing Chat を 考えてみましょう。最初はスタンドアロンで始まり、その後 Edge ブラウザーに移行し、現在は OS レベルで Windows 11 の検索バーに常駐しています。もちろん、Word、Excel、PowerPoint などの Office ツールも強化されています。同様に、 Google Bard は Gmail、ドキュメント、スライドなどの Workspace 製品内に表示されます。一方、Siri は Apple 自身のアプリケーションではどこにも見当たりません。
はい、Apple は Google や Microsoft ほど充実した機能を備えた生産性向上ツールキットを提供していません。しかし、それはまだどこかから始めなければなりません。その Siri 革命にとって最も緑豊かな牧草地は何でしょうか?自慢の iMessage。
Google が リッチ コミュニケーション サービス (RCS) に数百万ドルを費やし 、多くの人々が Apple に RCS の採用を懇願するオンラインの波を巻き起こしているにもかかわらず、Apple は 「ブルー バブル」特権 をあまりにも誇りに思い、そして保護しすぎて、クロスプラットフォームのメッセージングの調和をこれまで許可することはできませんでした。 。
WWDC と同じ日に、Google がスマート作成 (メッセージを入力する際にスマートな提案を表示して先を行く機能) が Google Chat に導入されると発表したのは、ほとんど滑稽な話です。この機能は、この種のアプリとしては世界で最も広く使用されている 2 つの Gmail と Google ドキュメントですでに利用可能です。
さらに、AI 支援の予測言語トリックは、2020 年から Gboard 経由で Google メッセージで利用できるようになりました。数週間前、Microsoft は、 Android と iOS の両方で、エクスペリエンス全体を SwiftKey モバイル キーボード 内に直接組み込みました。
可能性に満ちた世界
Apple が Siri で同様のことを実現できたら素晴らしいでしょう。たとえば、会話を状況に応じて読み取って、いくつかの提案を提示します。まさに それを見事な技巧で実行してくれる、 Paragraph AI のようなアプリがすでに存在しています。
おそらく、Siri はメール アプリを分析し、受信トレイの要約版を提示してくれるでしょう。 それをやってくれる Shortwave という優れたアプリが あります。本当に大好きです。おそらく、AI を活用した Microsoft Teams のように、Siri がビデオ通話を自動的に文字に起こし、電話アプリですぐに内容を理解できるように簡潔なバージョンを表示する日が来るかもしれません。
Bing Chat やそのテキストから写真への AI 画像ジェネレーターのようなものが、いつか Siri の助けを借りて Apple アプリに導入されるとしたらどうなるでしょうか?これらのトリックを活用する最良の方法は 、Apple の優れた Freeform コラボレーション アプリ です。
Apple は AI 競争に全力を尽くす必要はない。なぜなら、現在検索エンジンや生産性スイートの覇権を争っている Microsoft や Google ほど高い利害関係を持っていないからである。 Apple には埋めるべき狭い溝があるが、AI の概念に対する同社の嫌悪感は WWDC 2023 で全面的に露呈した。
さて、アプリ統合の領域にあまり踏み込まずに、音声アシスタントの Siri に焦点を当てましょう。現時点で必要なのは、イライラするほどロボットっぽく聞こえない会話機能の向上です。 AI にいくつかの AI 機能を与えて、微妙な会話を行い、Safari での単なる Web 検索のリダイレクトではない応答を返すことができれば、驚くべき効果が得られるでしょう。
Google は、Google アシスタントの中核に、多くのユーザーが実用性を得るよりもはるかに多くの機能を詰め込みすぎていると主張する人もいるでしょう。しかし同時に、Google アシスタントと Siri の機能の格差も不条理に偏っています。そして、 Google の Bard AI チャットボットが 何を実現できるかについても触れていません。
逆張りの観点から状況を見ると、ドキュメント、スライド、PowerPoint、Excel などの広範なツール スイートを継続的に反復して改善する必要がないため、Apple にとって状況は実際には楽です。
しかし同時に、これほど少量の生産性ソフトウェアを自由に使えるにもかかわらず、Apple が AI でそれを強化したり、有意義な Siri 統合を追加したりしていないことは、さらに当惑させられます。
反対側から見るとどう見えるでしょうか?
AI開発の業界の現状について、マイクロソフトの共同創設者ビル・ゲイツ氏は最近、未来のキラーパーソナルアシスタントを開発した者が競争に勝つだろう、そしてこのアシスタントはGoogle検索やAmazonのような巨大企業の状況を一変させる可能性が十分にあると述べた。またしても、Apple と Siri は会話に参加しませんでした。
Googleは非常に強気なので、伝えられるところによると、Googleアシスタントを解体し、Bardやその他のAI製品を改善するために総力を挙げたアプローチをとったという。何を言おうと、消費者向けガジェットを中心に AI の進歩がついに起こりつつあります。私たちはまだこの変化の初期段階にいますが、これまでに登場した製品は何百万もの人々の日常生活に大きな影響を与えています。
もし Siri が実際に Bing Chat、Bard、 ChatGPT など と競合していたらどうなるでしょうか?あるいは、少なくとも、彼らのトリックのほんの一握りだけを真似して、それで終わりにしようとしたらどうなるでしょうか?それはまだかなりの光景だろう。しかし、それらはすべて厳密に Siri の可能性の領域に存在します。
Apple の現在の軌道に従うと、機能的な変革を実行し、その存在感を発揮できるようになるまでには、しばらく時間がかかるでしょう。 Googleは5月の I/O 2023カンファレンス で「AI」と数十回発言し、ジョークの対象となった。 Apple の生意気な州幹部らは WWDC 2023 で AI という言葉を一度も口にしなかった。 代わりに、Apple はより技術的な派生語である機械学習を繰り返し使用した。
Apple が逃したものを、Microsoft は熱心に推進しています。 Cortana はついに終焉を迎えましたが、Halo にインスピレーションを得た音声アシスタントが埋もれる前に、Microsoft は Bing Chat を考案しました。
GPT-4 の会話部分を利用して、Bing Chat は Web をクロールして答えを見つけることができます。また、どの程度フォーマルに聞こえるかカジュアルに聞こえるかに基づいて応答を調整することもできます。セレブモードがあり、想像できる有名人のように話します。いくつかの単語のテキストに基づいて画像を生成することもできます。
何よりも、間もなく Office スイートが強化され、メールの作成、PowerPoint スライドの作成、Teams 会議の要約などが可能になります。 Google は同様の取り組みではそれほど進んでいませんが、Worksuite ポートフォリオのほぼすべての生産性ツールに生成 AI の機能を搭載しています。 Appleは議論全体に明らかに欠席している。
Apple のビジョンは別の場所を見据えている
OpenAI がその破壊的な ChatGPT ボットとともに AI レーダーに初めて現れたとき、さらなる難題を抱えてそれを無視するのは正気だったでしょう。しかし、Microsoft や Google などによる、そして毎日何億人ものユーザーが毎日使用する製品への急速な導入は、AI、特におしゃべりで実質的に生産性の高い種類の AI が生き残るというメッセージを国民に送りました。
そこで疑問が生じます。AI ゲームにおいて世界で最も価値があり、革新的な企業はどこでしょうか?そしてさらに重要なことは、Siri が次世代 AI のチョップに満ちた次の大きな飛躍を遂げるのはいつになるのでしょうか?
Apple は、Vision Pro ヘッドセットにより、市場の方向性は空間コンピューティングであることを明確にしました。 しかしこれは、XR ウェアラブル ギアにとって本当に「次の iPhone の瞬間」となるまでに数年かかる革命です。少なくとも、3,500 ドルが何百万もの人々がヘッドセットに喜んで支払える主流の価格になるまでは。
しかしその一方で、何億人もの iPhone、iPad、Apple Watch、Mac ユーザーが繁栄する世界があり、彼らは Siri の新しいトリックを使って生活を少しだけ楽にすることができます。
これまでのところ、Siri の前途は、より適切な言葉が見つからないが、機能的には不毛で、残念なほど遅れているように見える。