- 4K ゲームパフォーマンスの大幅な飛躍
- 優れたレイトレーシング性能
- 高出力と高熱だが扱いやすい
- DLSS 3 のパフォーマンスはチャートから外れています
- 非常に高価です
- DLSS 3 の画質には少し工夫が必要です
RTX 4090 は完全なお金の無駄であると同時に、これまでに作られた中で最も強力なグラフィックス カードでもあります。確かに、特に平均的な PC ゲーマーがシステムのアップグレードにどれくらいの金額を費やそうとしているかを考えると、この製品を評価するのは困難です。
Nvidia の新しい Ada Lovelace アーキテクチャをデビューさせた RTX 4090 は 論争に包まれ 、 GPU 価格 高騰の象徴として挙げられています。コストはかかりますが、特に DLSS 3 によって提供される機能強化により、優れたパフォーマンスを実現します。この猛獣 GPU のために、小銭を貯めて車を売るべきでしょうか?おそらくそうではありません。しかし、これは間違いなく、このテクノロジーが実際にどこまで実現できるかを示すエキサイティングなショーケースです。
ビデオレビュー
Nvidia RTX 4090のスペック
前述したように、RTX 4090 には、Nvidia の新しい Ada Lovelace アーキテクチャと、チップメーカー TSMC のより効率的な N4 製造プロセスが導入されています。 RTX 4090 のスペックを前世代とスペックごとに比較することは不可能ですが、Ada Lovelace を設計する際に Nvidia が何を優先したかについていくつかの洞察を得ることができます。
主な焦点はクロック速度です。 RTX 3090 Ti の 最高速度は約 1.8 GHz でしたが、RTX 4090 は 2.52 GHz のブースト クロックを備えた新しいノードの効率を示しています。これは同じボード電力 450 ワットですが、より多くのコアで実行されます。 RTX 3090 Ti は 11,000 CUDA コアにわずかに届かなかったのに対し、RTX 4090 は 16,384 CUDA コアを提供します。
RTX4090 | RTX3090 | |
建築 | エイダ・ラブレス | アンペア |
プロセスノード | TSMC N4 | 8nm サムスン |
CUDAコア | 16,384 | 10,496 |
レイトレーシングコア | 144 第三世代 | 82 2代目 |
テンソルコア | 576 4代目 | 328 第三世代 |
ベースクロック速度 | 2235MHz | 1394MHz |
クロック速度を上げる | 2520MHz | 1695MHz |
VRAM GDDR6X | 24GB | 24GB |
メモリ速度 | 21Gbps | 19.5Gbps |
バス幅 | 384ビット | 384ビット |
TDP | 450W | 350W |
特にゲームの場合、追加のコアがどれほど重要であるかを言うのは困難です。スタックの下位では、16 GB RTX 4080 には RTX 4090 の半分を少し超えるコアが含まれていますが、12 GB RTX 4080 にはさらに少ないコアが含まれています。クロック速度は依然として高いですが、現時点での RTX 40 シリーズ ファミリの仕様を見ると、コア数の増加は、少なくともゲームにおいては大きなセールス ポイントにはならないことが示唆されています。
合成とレンダリング
完全なベンチマーク スイートに入る前に、パフォーマンスの概要を見てみましょう。 3D Mark の Port Royal と Time Spy は、Nvidia の最新のフラッグシップがどのようにうまくスケールするかを示しており、Time Spy では RTX 3090 Ti に対して 58% の増加があり、Port Royal では RTX 3090 に対して 102% の増加を示しています。
3DMark は、ほとんどのゲーム (特に 4K) よりも CPU を 大きく考慮するため、パフォーマンスを判断する最良の方法ではないことに注意することが重要です。ただし、RTX 4090 の場合、3DMark はスケーリングをうまく示しています。実際、実際のゲームでの私の結果は、少なくともレイ トレーシングの外では、この合成ベンチマークが示唆するものよりも少し高いです。
また、RTX 4090 でのいくつかのコンテンツ作成タスクを評価するために Blender をテストしましたが、その改善は驚くべきものでした。 Blender は Nvidia の CUDA コアによって高速化されており、RTX 4090 はこれらの種類のワークロードに特に最適化されているようで、Monster および Junkshop シーンでは RTX 3090 および RTX 3090 Ti の 2 倍以上のスコアを示し、教室のシーン。 CUDAを搭載していないAMDのGPUには及ばない。
4Kゲーミングパフォーマンス
ジューシーな部分へ。すべてのテストは、 Ryzen 9 7950X と 32GB DDR5-6000 メモリを使用し、屋外テストベンチで行われました。テスト中は Resizeable BAR をオンにし、AMD GPU の場合は Smart Access Memory をオンにしました。
RTX 4090 は物理的にモンスターですが、4K ゲームのパフォーマンスに関してもモンスターです。データが不完全な Bright Memory Infinite と Horizon Zero Dawn を除く、私のテスト スイート全体で、RTX 4090 は RTX 3090 Ti より 68% 高速でした。 RTX 3090 と比較すると、ほぼ 89% の向上が見られます。
これは大きな飛躍であり、 のリリースで世代間で見られた 30% の向上よりもはるかに大きいです。そして、これらの数字はどれも、スケールアップを考慮したものではありません。これはレイ トレーシングを含む生のパフォーマンスであり、RTX 4090 は前世代と比べて大きなリードを示しています。
おそらく最も印象的なのは Cyberpunk 2077 でしょう。RTX 4090 は、最大設定の 4K で RTX 3090 Ti よりも 50% 強高速であり、これは十分に印象的です。ただし、RTX 4090 が 60 フレーム/秒 (fps) を達成しているという事実が際立っています。前世代の 最も強力なグラフィックス カード でも、 ディープ ラーニング スーパー サンプリング (DLSS) の支援がなければ 60 fps を超えることはできませんでした。 RTX 4090 は、すべてのピクセルをレンダリングしながらその障壁を打ち破り、かなりのリードでそれを達成します。
Gears Tactics も RTX 4090 の威力を示し、RTX 3090 Ti に 73% の差をつけて勝利しました。 Red Dead Redemption 2 のような Vulkan タイトル では、その差は小さくなりますが、私のテストによると、RTX 4090 は依然として 52% のリードを保っていました。これはパフォーマンスにおける世代間の飛躍的な飛躍ですが、それでも Nvidia が当初約束したものよりも下回っています。
Nvidia は RTX 4090 を RTX 3090 Ti よりも「2 ~ 4 倍高速」であると宣伝しています が、それは真実ではありません。以前のトップドッグよりもはるか に 高速ですが、Nvidia の主張は、DLSS 3 を考慮した場合にのみ意味を成します。DLSS 3 は印象的であり、このレビューの後半で説明します。しかし、それはすべてのゲームにあるわけではなく、それでもある程度の作業が必要です。ありがたいことに、RTX 4090 の本来のパフォーマンスを考慮すると、DLSS は「必須」というよりは「あれば便利」という感じです。
Assassin’s Creed Valhalla や Forza Horizon 5 などの AMD が宣伝するタイトルでは、 RTX 4090 は依然としてその力を示していますが、現在は AMD の RX 6950 XT に対抗しています。 4K の Valhalla では、RTX 4090 が RX 6950 XT に対して 63% の差を付けました。 Forza Horizon 5 ではマージンがより狭く、 AMD の現在の製品と非常にうまく調和しているようです。ただし、リードが少なくても、RTX 4090 は RX 6950 XT を 48% 上回っています。
これらの比較は印象的ですが、RTX 4090 は競合他社と同等の競争条件にありません。 Nvidia の最新フラッグシップは 1,600 ドルで、現在入手可能な最も高価な GPU よりも大幅に高価です。ただし、RTX 4090 が提供するパフォーマンスを考えると、実際には、より安価な RTX 3090 や RTX 3090 Ti よりも優れています。
フレームあたりのコストの点では、RTX 3080 10GB の 700 ドルとほぼ同じ価格になります。これは価値を判断する最良の方法ではありません。そもそも RTX 4090 に費やすだけの余分な現金があることを前提としており、DLSS 3 などの機能は考慮されていません。しかし、クレイジーに聞こえるかもしれませんが、1,600 ドルはRTX 4090 が提供する 4K パフォーマンスの割にかなり妥当な価格です。
発売の話題が落ち着いたので、 RTX 4080 のレビュー と RX 7900 XTX のレビューを 必ず読んで、RTX 4090 が他のハイエンド GPU とどのように比較できるかを確認してください。
1440p のゲームパフォーマンス
1440p の RTX 4090 を購入している場合は、お金の無駄です (代わりに、 最高の 1440p グラフィックス カード に関するガイドをお読みください)。前世代に比べて依然として大幅な改善が見られますが、利益率ははるかに小さくなっています。 RTX 3090 Ti と比べて 48% 増加し、RX 6950 XT と比較して 68% 増加していることがわかります。これらは依然として世代間の大きなジャンプですが、RTX 4090 は 4K で真に輝きます。
1440p で CPU が少し制限さ れ始め、1080p に下げると、結果はさらに厳しくなります。そして率直に言って、1440p での追加のパフォーマンスは 4K の場合ほど目立たないのです。たとえば 、Gears Tactics では、RTX 4090 は RTX 3090 Ti より 36% 高速であり、Nvidia の最新カードが 4K で示した 73% のリードよりも低下しています。実際のフレームレートもそれほど印象的ではありません。確かに、RTX 4090 は RTX 3090 Ti よりもはるかに優れていますが、500 ドル安い GPU がすでに 160 fps を超えているのに、 Gears Tactics で 200 fps 以上が必要になるとは想像しにくいです。
4K では、RTX 4090 は主要なマイルストーンを達成しました。DLSS なしの Cyberpunk 2077 では 60 fps 以上、 Assassin’s Creed Valhalla では 高リフレッシュ レート モニター の 144Hz マーク近くなどです。1440p では、RTX 4090 の方が確かに高い数値を示していますが、その数値は実際の画面よりも紙の上で見たほうがはるかに印象的です。
レイトレーシング
Nvidia は Turing 世代から レイ トレーシング のチャンピオンであり続けていますが、Ada Lovelace は大きな見直しが行われた最初の世代です。 RTX 4090 の中心には、パフォーマンスを向上させ、Shader Execution Reordering (SER) を導入する再設計されたレイ トレーシング コアがあります。 SER は基本的に、レイ トレーシング操作を処理するためのより効率的な方法であり、ボトルネックが必ず発生する直線ではなく、GPU パワーが利用可能になったときに実行できるようになります。また、Windows でハードウェア アクセラレーションによる GPU スケジューリングを有効にする必要もあります。
そしてそれはうまくいきます。通常、レイ トレーシングのマージンははるかに小さくなりますが、RTX 4090 はレイ トレーシングをオンにすると実際に高いゲインを示します。たとえば 、Cyberpunk 2077 では、 Ultra RT プリセットを使用すると、RTX 4090 は RTX 3090 Ti よりも 71% 近く高速になります。これは DLSS を考慮する前の話です。 AMD の GPU は、レイ トレーシングのパフォーマンスではるかに遅れをとっており、さらに大きな差を示しています。このベンチマークでは、RTX 4090 は RX 6950 XT よりも完全に 152% 高速です。
同様に、 Metro Exodus Enhanced Edition では RTX 4090 が RTX 3090 Ti より 80% 向上し、 Bright Memory Infinite では RTX 4090 が RTX 3090 より 93% 優れていることが示されました。 Nvidia の主張によると、RTX よりも「2 ~ 4 倍高速」 3090 Ti は DLSS 3 なしでは耐えられないかもしれませんが、レイ トレーシングのパフォーマンスはその水準にはるかに近づきます。
また、4K パフォーマンスと同様に、RTX 4090 はレイ トレーシングをオンにすると実際に違いを生むパフォーマンスの向上を示します。 Bright Memory Infinite では、 RTX 4090 は、高いリフレッシュ レートを活用するか、60 fps をギリギリで達成するかの違いです。そして 、サイバーパンク 2077 では、 RTX 4090 が文字通りプレイ可能とプレイ不可能の違いとなります。
DLSS 3 テスト済み
が、DLSS 3 はこの技術にとって大きな変化です。 オプティカル フロー AI フレーム生成が 導入されています。これは、AI モデルが 1 フレームおきに完全に固有のフレームを生成することになります。理論的には、CPU によって 100% 制限され、解像度を低くしてもメリットが見られないゲームであっても、パフォーマンスが 2 倍になることを意味します。
現実の世界ではまったくそのような状況ではありませんが、DLSS 3 は依然として非常に印象的です。私は 3DMark の DLSS 3 テストから始めました。これは、DLSS をオフにしてからオンにして Port Royal ベンチマークを実行するだけです。私の目標は、この機能を可能な限り拡張することであったため、DLSS をウルトラ パフォーマンス モードに設定し、解像度を 8K に設定しました。これは、DLSS 3 の機能を最もよく示すもので、この技術によりフレーム レートが 578% 向上しました。それは正気の沙汰ではありません。
実際のゲームでは、それほど顕著な向上はありませんが、DLSS 3 は依然として印象的です。 Nvidia は A Plague Tale: Requiem の初期ビルドを提供し、 DLSS は設定を最大にした 4K で平均フレーム レートを 128% 向上させることに成功しました。これは DLSS の自動モードを使用した場合です。より積極的な画質プリセットを使用すると、ゲインはさらに高くなります。
ただし 、A Plague Tale: Requiem は DLSS 3 の重要な側面を明らかにしています。つまり、かなりの量のオーバーヘッドが発生します。 DLSS 3 は 2 つの部分から構成されます。最初の部分は DLSS 超解像度です。これは、以前の RTX 世代で見られたものと同じ DLSS です。 RTX 20 シリーズおよび 30 シリーズ GPU では引き続き動作するため、前世代のカードを使用するゲームでも引き続き DLSS 3 超解像度を使用できます。
DLSS フレーム生成は 2 番目の部分であり、RTX 40 シリーズ GPU 専用です。 AI は 1 フレームおきに新しいフレームを生成しますが、計算コストが高くなります。そのため、フレーム生成をオンにすると Nvidia Reflex が 強制的にオンになり、オフにすることはできません。
フレーム生成の仕組みを理解すれば、超解像度だけで得られるフレーム レートの 2 倍のフレーム レートが得られる はずです が、実際はそうではありません。以下の Cyberpunk 2077 でわかるように、フレーム生成の結果は、GPU が約 65 フレームのみをレンダリングしており、残りは AI から来ていることを意味します。超解像度を単独で使用すると、その結果は 30 fps 近くも跳ね上がります。これが DLSS フレーム生成のオーバーヘッドです。
明らかに、フレーム生成は最高のパフォーマンスを提供しますが、超解像度は時代遅れであると考えないでください。フレーム生成により DLSS フレーム レートが 2 倍になるように見えますが、実際にはそれ自体で超解像度にはるかに近くなります。
DLSS は画質と切り離して語ることはできません。DLSS 3 は優れていますが、画質部門ではまだ改善が必要です。フレームは 1 つおきに GPU 上で生成され、ディスプレイに直接送信されるため、HUD などの要素をバイパスすることはできません。これらは生成されたフレームの一部であり、以下の Cyberpunk 2077 でわかるように、アーティファクトの準備が整っています。移動するクエスト マーカーは画面上を移動すると飛び散りますが、要素の移動に合わせて AI モデルはピクセルをどこに配置するかがわかりません。通常、HUD 要素は DLSS の一部ではありませんが、フレーム生成では、HUD 要素を考慮に入れる必要があります。
同じ動作が実際のシーンにも現れます。たとえば 、「A Plague Tale: Requiem」では、 AI が草をどこに配置するか、どこに足を配置するかを判断するのに苦労する中、草の中を走ると煉獄の薄い層がどのように生成されるかを確認できます。同様に、ポート ロイヤルではエッジが柔らかく、ピクセルがかなり不安定でした。
これらのアーティファクトは動いているときに最もよく見えるため、120 fps で大量の 4K 映像をキャプチャしました。以下でご覧ください。できるだけ多くのフレームを表示できるように、DLSS 比較の速度を 50% 遅くしましたが、YouTube の圧縮と、ゲームプレイをキャプチャするときに真の品質比較を行うのが難しいという事実に留意してください。生で見るのが一番です。
プレイ中に DLSS 3 が被る画質の低下は、DLSS 3 が提供するパフォーマンスの向上によって簡単に相殺されます。ただし、フレーム生成は常にオンにする必要がある設定ではありません。レイ トレーシングとすべての視覚的な付加機能を推し進めるときに最高のパフォーマンスを発揮します。うまくいけば、それも改善されるでしょう。 Nvidia がフレーム生成の側面を改良し続けると私は確信していますが、現時点ではまだほころびが見られます。
電力と熱
RTX 4090 の発表に至るまで、わいせつな電力需要に関する 憶測が飛び交いました 。 RTX 4090 は多くの電力を消費します (Founder’s Edition では 450W、Asus ROG Strix RTX 4090 などのボード パートナー カードではさらに多くなります)。ただし、RTX 3090 Ti の消費電力を超えることはありません。そして、私のテストによると、RTX 4090 の実際の描画は少し低くなっています。
以下のグラフは、テスト中に測定した最大消費電力を示しています。これは最大出力ではありません。専用のストレス テストを行うと、RTX 4090 の性能がさらに向上します。ただし、ゲームはストレス テストではないため、常に最大出力に達する (またはそれに近づく) とは限りません。他の Founder’s Edition モデルと比較すると、RTX 4090 の実際の消費電力は RTX 3090 Ti よりも約 25 W 少なくなります。ただし、オーバークロックされたボード パートナー カードの方が上位に上がるため、その点に留意してください。
サーマルの場合、RTX 4090 は私のテスト スイートで摂氏 64 度でピークに達しましたが、これはちょうどそれが配置されるべき温度に近い値です。クロック速度とコア数が向上した小型の は、最高の熱結果を示し、ピークは 78 度でした。ただし、これらの数値はすべて屋外のテストベンチで収集されたものであるため、RTX 4090 をケースに入れると温度はさらに高くなります。
Nvidia RTX 4090を購入する必要がありますか?
GPU に 1,600 ドル使えるのであれば、RTX 4090 を買うべきです。ただし、ほとんどの人はグラフィックス カードに使える 1,600 ドルを持っていません。ここが RTX 4090 の難しいところです。
RTX 4090 がどれほど強力であるか、1,600 ドルが比較的妥当な価格であるか、DLSS 3 がゲーム パフォーマンスをいかに大幅に向上させるかを示すチャートを次々と表示できます。しかし、RTX 4090 の価格が多くのフルゲーミング PC よりも高いという事実は変わりません。これは、ほとんどの人にとってグラフィック カードとは程遠いものです。これは、ほとんどの愛好家にとってグラフィックス カードですらない。
RTX 4090 にはそれだけの価値がありますが、だからといって 購入する必要があるわけではありません 。次世代についてはまだ非常に不完全なイメージしかありません。RTX 4080 モデルは 11 月に登場し、 AMD は 11 月 3 日に RX 7000 GPU を発売する予定です 。ほとんどの人にとって、最善の選択肢は待つことです。さらなる GPU 不足 に向かうわけではないため、これらのカードが発売されたら RTX 4090 が より 高価になると信じる理由はありません。
単に最高であるという理由だけで最高のものを求める少数の人々に属しているのであれば、RTX 4090 がその称号をしっかりと保持しています。 RTX 4090 は、平均的な PC ゲーマーが支出しようとしているよりもはるかに高価ですが、繰り返しになりますが、平均的なグラフィック カードよりもはるかに高価です。