본문으로 바로가기
반응형

 

NVIDIA GeForce RTX 4060은 Ada Lovelace GPU를 기반으로 하는 최신 그래픽 아키텍처를 제공하는 차세대 하이엔드 게임용 그래픽 카드가 될 것입니다. 그래픽 카드는 300~400달러 미국 시장에서 매우 인기 있는 게임용 그래픽 카드인 RTX 3060을 대체할 것입니다.

 

NVIDIA GeForce RTX 4070 그래픽 카드 - 순수하게 열광적인 게이머를 위해 설계됨

 

최고의 게임 성능을 제공하는 고급형 GeForce RTX 4090, GeForce RTX 4080 및 GeForce RTX 4070 시리즈 그래픽 카드에 대한 열정을 부인할 수는 없지만 RTX 4060 시리즈 그래픽 카드는 US $300-$400 주변에서 설계될 것입니다. 여전히 많은 성능을 제공하는 주류 가격대인 세그먼트입니다. 간단합니다. RTX 4090 시리즈는 지출 금액에 대해 걱정하지 않고 최고를 원하는 사용자를 대상으로 하고 RTX 4080 시리즈는 최상의 가격으로 최고의 성능을 원하는 사용자를 대상으로 합니다. RTX 4070은 고급 게임을 위한 최적의 제품이 될 것이며 RTX 4060은 성능을 감안할 때 무시하기 힘든 가격으로 게임 대중을 위해 설계되었습니다.

 

이전 GeForce RTX 3060은 RTX 2080 SUPER보다 크게 개선된 것으로 선전되었습니다. 이 카드는 결국 약속한 성능 목표를 달성했지만 RTX 2060 SUPER와 비교할 때 기껏해야 25-30% 향상되었습니다. 이는 주로 RTX 2060 SUPER가 이미 RTX 2060의 업그레이드 버전이라는 사실 때문이었습니다. 그러나 RTX 20 시리즈 이후로 RTX 30은 고유한 Ti 및 Non-Ti 맛을 갖게 되었습니다.

 

 

RTX 3060 Ti는 RTX 3060보다 약 30% 빠릅니다. RTX 3060 Ti는 또한 RTX 2060 SUPER보다 30%, 표준 RTX 2060보다 40-45% 빠릅니다. 반면에 RTX 3060 Non-Ti는 RTX 2060 SUPER보다 약 10% 빠르며 RTX 2060 Non-SUPER 그래픽 카드보다 20% 빠릅니다. 따라서 성능을 기반으로 하면 RTX 3060 Ti는 실제로 더 빠르지만 더 비쌌지만 여전히 이전 제품에 비해 더 나은 가치를 제공했습니다.

 

예를 들어, RTX 3060 Ti와 RTX 2060 SUPER는 모두 MSRP가 399달러이지만 3060 Ti는 30% 더 빠른 성능을 제공했습니다. 한편, RTX 3060 Non-Ti는 RTX 2060 Non-SUPER보다 20달러 저렴하지만 20% 성능 향상을 제공했습니다. RTX 3060은 Founders Edition 버전으로 출시된 적이 없기 때문에 대부분의 모델은 US $15-$20 더 비싸므로 하루가 끝나면 RTX 2060 Non-SUPER와 동일한 가격에 20% 상승했습니다.

 

NVIDIA는 RTX 3060 Ti의 8GB에 비해 12GB의 메모리가 장착된 RTX 3060 그래픽 카드를 얻기 위해 게임 관중을 설득했습니다. 카드가 Ti 버전의 256-bit 버스에 비해 낮은 192-bit 버스를 특징으로 하여 대역폭이 더 낮아졌기 때문에 성능은 크게 바뀌지 않았습니다.

 

우리는 차세대 게임 설루션에서도 비슷한 상황을 예상해야 하지만 고려해야 할 중요한 요소는 GPU가 점점 더 많은 전력을 소모하고 더 비싸다는 것입니다. 우리가 더 나은 제품을 얻음에 따라 미래에도 계속될 수 있는 추세이지만, 그 대가로 항상 최종 소비자에게 지불해야 하는 비용이 있습니다. 따라서 지금까지 알고 있는 것으로 시작하여 먼저 차세대 GeForce RTX 40 시리즈 카드를 구동할 새로운 Ada Lovelace 또는 AD10* 클래스 GPU를 살펴봐야 합니다.

 

NVIDIA의 AD106 'Ada Lovelace' GPU - 차세대 주력 제품입니다.

 

GPU 구성부터 NVIDIA GeForce RTX 4060 시리즈 그래픽 카드는 AD104 및 AD106 GPU를 모두 사용할 수 있습니다. 그 이유는 RTX 3060 Ti가 GA104 GPU를 기반으로 하고 RTX 3060이 GA106 GPU를 기반으로 하는 현재 지포스 RTX 30 시리즈의 상황과 같다. 여기에서 이미 AD104 GPU에 대해 자세히 설명했으므로 AD106 GPU와 제공해야 하는 사항을 살펴보겠습니다. GPU는 약 200mm2를 측정하며 그린 팀을 위해 설계된 TSMC의 5nm(N5) 노드의 최적화된 버전인 TSMC 4N 프로세스 노드를 활용할 것이라고 합니다.

 

 

NVIDIA Ada Lovelace AD106 GPU는 최대 3개의 GPC(그래픽 처리 클러스터)를 제공할 것으로 예상됩니다. 이것은 GA106 GPU와 동일한 GPC 수입니다. 각 GPU는 6개의 TPC와 2개의 SM으로 구성되며 기존 칩과 동일한 구성입니다. 각 SM(Streaming Multiprocessor)에는 GA106 GPU와 동일한 4개의 하위 코어가 있습니다. 변경된 사항은 FP32 및 INT32 코어 구성입니다. 각 서브 코어에는 128개의 FP32 장치가 포함되지만 FP32+INT32 장치를 결합하면 최대 192개가 됩니다. 이는 FP32 장치가 IN32 장치와 동일한 서브 코어를 공유하지 않기 때문입니다. 128개의 FP32 코어는 64개의 INT32 코어와 별개입니다.

 

따라서 전체적으로 각 하위 코어는 32개의 FP32와 16개의 INT32 장치로 구성되어 총 48개의 장치가 됩니다. 각 SM에는 총 128개의 FP32 장치와 64개의 INT32 장치가 포함되어 총 192개의 장치가 있습니다. 총 36개의 SM 장치(GPC당 12개)가 있으므로 총 6,912개의 코어에 대해 4,608개의 FP32 장치와 2,304개의 INT32 장치를 보고 있습니다. 각 SM에는 SM당 64개 랩에 대한 2개의 랩 일정(32 스레드/CLK)도 포함됩니다. 이는 GA102 GPU에 비해 코어(FP32+INT32)가 50% 증가하고 랩/스레드가 33% 증가합니다.

 

NVIDIA AD103 'Ada Lovelace' 게임용 GPU 'SM' 블록 다이어그램(이미지 제공: Kopite7kimi):

 

 

캐시로 넘어가면 이것은 NVIDIA가 기존 Ampere GPU보다 크게 향상된 또 다른 부분입니다. Ada Lovelace GPU는 SM당 192KB의 L1 캐시를 포함하며 이는 Ampere보다 50% 증가한 것입니다. 유출에 언급된 대로 L2 캐시가 32MB로 증가합니다. 이는 3MB의 L2 캐시를 호스팅하는 Ampere GA106 GPU보다 10.6배 증가한 것입니다. 캐시는 GPU 전체에서 공유됩니다.

 

마지막으로 GPC당 16으로 고정되는 ROPs가 있습니다. 현재 GA106 GPU와 동일한 최대 48개의 ROPs를 보고 있습니다. 또한 최신 4세대 Tensor 및 3세대 RT(Raytracing) 코어가 Ada Lovelace GPU에 주입되어 DLSS 및 Raytracing 성능을 다음 수준으로 높이는 데 도움이 될 것입니다. 전반적으로 Ada Lovelace AD106 GPU는 다음을 제공합니다.

 

 * GA106 GPU와 동일한 수의 GPC

 * +20% 코어 대 GA106 GPU

 * 50% 더 많은 L1 캐시(Ampere GA106 대비)

 * 10x 이상의 L2 캐시(Ampere GA106 대비)

 * 동일한 수의 ROP(Ampere GA106 대비)

 * 4세대 Tensor 및 3세대 RT 코어

 

NVIDIA AD106 'Ada Lovelace' 게임용 GPU 블록 다이어그램 목업(이미지 제공: SemiAnalysis):

 

 

2-3GHz 범위라고 하는 클럭 속도는 방정식에 포함되지 않으므로 Ampere에 비해 코어당 성능을 개선하는 데에도 중요한 역할을 합니다.

 

NVIDIA GeForce RTX 4070 시리즈 예비 사양:

 

 

NVIDIA GeForce RTX 4060 그래픽 카드 사양

 

GeForce RTX 3060 시리즈에서 보았듯이 NVIDIA는 RTX 4060 시리즈 그래픽 카드의 두 가지 구성을 가질 수 있습니다. 현실적으로 RTX 4060과 RTX 4060 Ti의 두 가지 모델이 있을 것으로 예상합니다. 기존 세대는 RTX 3060 Ti와 RTX 3060을 몇 달 간격으로 출시했으며 볼륨 세그먼트로 알려져 있으므로 NVIDIA는 두 가지 설루션(하나는 $300-350, 하나는 $400-450 US)을 즉시 메인스트림 게이머들에게 포지셔닝할 수 있습니다.

 

현재로서는 AD104 GPU가 GeForce RTX 4060 시리즈 내에서 활용되는지 여부는 알 수 없으므로 AD106 GPU를 사용할 표준 RTX 4060에 중점을 둘 것입니다.

 

NVIDIA GeForce RTX 4060 '예상' 사양

 

RTX 4060 시리즈 라인업에서 AD104/AD106을 혼합하거나 AD106으로 전환하기로 한 NVIDIA의 결정에 따라 우리는 축소된 RTX 4060 또는 전체 구성을 볼 수 있는 반면 Ti는 축소된 AD104 구성을 사용할 수 있습니다. AD106 GPU에는 32MB의 L2 캐시와 최대 48개의 ROPs가 포함됩니다.

 

클럭 속도는 아직 확인되지 않았지만 TSMC 4N 프로세스가 사용되는 것을 고려할 때 2.0-3.0GHz 범위의 클럭이 예상됩니다. 일반적인 클록 속도 범프보다 더 높은 것은 NVIDIA가 Samsung 8nm 노드가 있는 Ampere GPU가 실제로 일부 최적화가 적용된 10nm 프로세스 노드임을 고려하여 2nm 점프를 하고 있다는 사실에서 비롯됩니다. NVIDIA는 7nm를 건너뛰고 5nm 노드로 곧장 나아가고 있으며 기본 버전이 아니라 최적화된 버전입니다. TSMC 16nm 노드의 Pascal을 통해 NVIDIA는 엄청난 주파수 도약을 달성했으며 이번에도 비슷한 도약을 기대할 수 있습니다.

 

 
메모리 사양과 관련하여 GeForce RTX 4060은 320GB/s 이상의 대역폭에 대해 128-bit 버스 인터페이스에서 더 빠른 20Gbps 이상의 속도로 올 수 있는 8GB GDDR6X 용량을 제공할 것으로 예상됩니다. 'Ti' 버전은 AD104 GPU로 끝나는 경우 192-bit 버스 인터페이스에서 최대 12GB의 메모리를 제공할 수 있습니다. GeForce RTX 4060 그래픽 카드는 또한 RTX 3060보다 30%, RTX 3060 Ti보다 10% 증가한 220W의 TGP를 제공한다고 합니다. 이것은 엄청난 TGP 증가이며 NVIDIA가 효율성 수치를 유지하려면 성능이 정말 좋아야 합니다.
 
 
NVIDIA GeForce RTX 4060 그래픽 카드는 최신 4세대 텐서 코어, 3세대 RT 코어, 최신 NVENC 인코더 및 NVCDEC 디코더와 같은 모든 최신 NV 기능 세트를 흔들며 최신 API를 지원합니다. DLSS, Reflex, Broadcast, Resizable-BAR, Freestyle, Ansel, Highlights, Shadowplay 및 G-SYNC 지원 등 최신 RTX 기능도 모두 포함되어 있습니다.

 

NVIDIA GeForce RTX 4060 시리즈 예비 사양:

 

 

NVIDIA GeForce RTX 4060 그래픽 카드 성능

 

게임용 GPU의 성능에 관해서는 출시가 조금 멀기 때문에 여기서는 이론적인 수치만 사용할 수 있지만 우리가 알고 있는바에 따르면 RTX 40 시리즈 카드는 100TFLOPs 컴퓨팅 마력 제한에 도달한 최초의 게임용 카드일 수 있습니다.

 

비교를 위해:

 

NVIDIA GeForce RTX 4090 Ti: ~103 TFLOPs(FP32)(2.8GHz 클록 가정)

NVIDIA GeForce RTX 4090: ~90 TFLOPs(FP32)(2.8GHz 클럭 가정)

NVIDIA GeForce RTX 4080: ~50 TFLOPs(FP32)(2.5GHz 클럭 가정)

NVIDIA GeForce RTX 3090 Ti: 40 TFLOPs(FP32)(1.86GHz 부스트 클럭)

NVIDIA GeForce RTX 4070 Ti: ~38 TFLOPs(FP32)(2.5GHz 클럭 가정)

NVIDIA GeForce RTX 4070: ~36 TFLOPs(FP32)(2.5GHz 클록 가정)

NVIDIA GeForce RTX 3090: 36 TFLOPs(FP32)(1.69GHz 부스트 클럭)

NVIDIA GeForce RTX 3080: 30 TFLOPs(FP32)(1.71GHz 부스트 클럭)

NVIDIA GeForce RTX 3070 Ti: 22 TFLOPs(FP32)(1.77GHz 부스트 클럭)

NVIDIA GForce RTX 4060: 20 TFLOPs(FP32)(2.2GHz 클록 추정)

NVIDIA GeForce RTX 3070: 20 TFLOPs(FP32)(1.72GHz 부스트 클럭)

NVIDIA GeForce RTX 3060 Ti: 16 TFLOPs(FP32)(1.65GHz 부스트 클럭)

NVIDIA GeForce RTX 3060: 13 TFLOPs(FP32)(1.77GHz 부스트 클럭)

 

이론적인 클럭 속도 2.2GHz를 기반으로 최대 20TFLOPs의 컴퓨팅 성능을 얻을 수 있으며, 더 높은 부스트 클럭을 제안한다는 소문이 있습니다. 이제, 이것들은 분명히 평균적인 '게임' 클럭보다 더 높은 AMD의 최대 주파수와 비슷한 최대 클럭처럼 들립니다. 20TFLOPs 컴퓨팅 성능은 '70개 등급 플래그십'보다 '60개 등급' GPU에서 더 높은 성능을 발휘한다는 것을 의미합니다. 그러나 컴퓨팅 성능이 반드시 전체 게임 성능을 나타내는 것은 아니라는 점을 명심해야 합니다.

 

 

이는 이전 버전에 비해 GeForce RTX 4060 그래픽 카드의 컴퓨팅 성능이 약 54% 향상되며 해당 부서에서도 크게 향상될 것으로 예상되는 RT 및 Tensor 코어 성능을 고려하지 않은 것입니다. 이제 FLOPs는 그래픽이나 게임 성능을 반드시 반영하는 것은 아니지만 비교에 사용할 수 있는 메트릭을 제공합니다.

 

 

게이머는 이러한 그래픽 카드와 DLSS를 사용하여 뛰어난 1080p 및 1440p 게임을 기대해야 합니다. '60' 시리즈는 항상 프리미엄 1080p 및 주류 1440p 게임을 대상으로 했지만 이 카드는 주류 가격대에서 Reflex, DLSS 및 다양한 스트리밍 기능과 같은 기술을 갖춘 eSports에서 정말 인기가 있을 것으로 기대합니다.

 

NVIDIA GeForce RTX 4060 그래픽 카드 가격 및 가용성

 

NVIDIA GeForce RTX 3060은 미화 329달러에 출시되었으며 RTX 3060 Ti는 399달러에 출시되었습니다. NVIDIA가 여기저기서 10~20달러의 미국 가격 조정을 통해 이 카드에 대해 동일한 가격을 유지할 것으로 예상할 수 있습니다.

 

NVIDIA는 실제로 $300-$400 미국 부문에서 더 많은 게이머를 확보해야 하지만 가격 가치가 있는 제품을 제공해야 합니다. RTX 3060 Ti는 괜찮은 제품인 반면 RTX 3060은 AMD Radeon RX 6600 시리즈에 대해 매우 경쟁력이 있는 것으로 판명되었습니다. 이제 메인스트림 왕의 지위를 유지할 것인지, 아니면 게이머와 자신 모두에게 이익이 되지 않는 길을 갈 것인지 결정하는 것은 NVIDIA의 몫입니다.

 

 

NVIDIA GeForce RTX 40 시리즈 그래픽 카드는 3분기에 공개될 것이라는 소문이 있고 2022년 4분기에 출시될 예정이므로 NVIDIA가 앞으로 몇 달 안에 무엇을 할지 확실히 알 수 있을 것입니다.

 

NVIDIA GeForce GPU 세그먼트/계층 가격

 

출처 : 퀘이사존 
https://quasarzone.com/bbs/qn_hardware/views/1266033

반응형

댓글을 달아 주세요