GM200, Fiji XT 성능 예측

Author : Daeguen Lee

(Any action violating either CCL policy or copyright laws is strictly prohibited)

 

 

 

최근 며칠 간격으로 해외 웹사이트에 GM200 / Fiji XT의 추정 스펙이 올라와 화제가 되고 있습니다. 아시다시피 현재 GTX 970 / 980이란 이름으로 출시된 GM204는 과거 GK104가 그러했듯 해당 세대의 최상위 칩이 아니기 때문에 하이엔드 매니아 계층을 중심으로 '2세대 맥스웰'의 최상위 모델이 될 GM200에 대한 관심이 커져만 가는 중인데다, 다른 한편으로는 (최상위 칩이 아닌) GTX 970 / 980의 등판만으로도 벌써부터 움츠러든 AMD에게 구원투수로써의 역할이 절실히 기대되는 차세대 라데온 Fiji XT에 대한 관심 역시 그에 비례해 커지고 있는 상황입니다. 과연 유출된 추정 스펙에 근거해 계산해 본 성능은, 양사에게 어떤 희비를 가져다줄지 한번 알아봅시다.

 

- GM200 (지포스 GTX TITAN II, GTX TITAN X, GTX 980 Ti 등으로 명명될 것으로 예상) 추정 스펙 : http://bit.ly/1zlRvQn

- Fiji XT (라데온 R9 390X로 명명될 것으로 예상) 추정 스펙 : http://bit.ly/1wWfTZq

 

위 링크에서 확인할 수 있듯, 일단 GM200은 3072 SP / 192 TMU / 96 ROP 등의 스펙을 가질 것으로 추측됩니다. 이는 GM204 대비 거의 전 영역에 걸쳐 1.5배 증대된 것으로 요약할 수 있겠는데, 성능 역시 비슷한 비율로 향상되었을 것으로 생각됩니다. 보수적으로 잡아 가상 GM200의 작동 속도를 1.1GHz로, 메모리 클럭은 현재 엔비디아의 플래그십에 공통적으로 적용된 7.0Gbps로 가정하고 VGA 성능 계산기를 돌려 보면 아래 그림과 같은 결과를 얻습니다.

 

 

SP/TMU 갯수에 각각 1.35를 곱한 까닭에 관해서는 '맥스웰 계수'를 구했던 이전의 글들을 참조하시기 바랍니다.

 

- Deriving "Maxwell coefficient" : http://iyd.kr/668

- "지포스 GTX 960 성능 공개 : 2세대 맥스웰(GM204) 예측을 바탕으로" 글 중 서문 : http://iyd.kr/681

 

일단 차기 엔비디아 제왕 자리를 미리 예약한 GM200의 경우, 아버지뻘이라 할 수 있을 GTX TITAN Black과 비교하면 46%가량 향상된 성능을 보일 것으로 추측됩니다. 또한 (GTX TITAN Black / GTX 780 Ti와 동일한) "완전한" GK110 칩을 두 개 탑재한 GTX TITAN Z보다는 약 12%정도 낮은 성능을 보일 것으로 예상되어, 단일칩으로는 명실상부한 지위를 누릴 것이 확실시됩니다.

 

한세대 전인 케플러들과의 비교는 이러했고, 그렇다면 같은 세대 동생뻘인 GM204와 비교해 보면 어떨까요. 우선 위와 같은 방식으로 "맥스웰 계수" (= 1.35)를 적용하여 계산해 본 GTX 980 / GTX 970의 성능을 보겠습니다.

 

 

계산기에 따르면 GTX 980의 성능은 GTX TITAN Black 대비 9% 정도, GTX 780 Ti 대비 14% 정도 높게 나타납니다. GTX 980과 비교했을 때 GM200의 성능은 대략 134%, 그러니까 약 3분의 1정도의 성능 향상을 얻게 되는 셈입니다. 코어 클럭을 보수적으로 예측해 GTX 980보다 낮게 잡았음을 염두에 두시기 바랍니다.

 

 

같은 방식으로 계산해 본 GTX 970의 성능은 GK110 풀스펙 (= GTX TITAN Black) 과 매우 비슷한 수준입니다. GTX 970과 비교하면 GM200의 성능은 약 1.5배쯤이 됩니다.

 

지금까지 GM200의 추정 스펙을 바탕으로 예상되는 성능을 알아 보았습니다. 하지만 여기서 끝내면 재미없죠. 엔비디아의 영원한 숙적인 AMD의 차기 칩에 관한 정보도 실로 오랜만에 흘러 나왔는데, 이를 바탕으로 차세대 라데온의 성능을 계산해 보았습니다.

 

일단 유출된 추정 스펙을 요약하자면 다음과 같습니다 : 4096 SP / 코어클럭 1GHz / 640GB/s HBM 적용

 

앞서 GM200의 스펙이 상당히 디테일하게 유출된 것과 달리, 많은 부분을 받아들이는 사람의 상상력에 의존해야겠는데, 편의상 GCN 1.0 / 1.1 / 1.2에 걸쳐 공통적으로 적용되던 SP:TMU 비율을 적용해 256개의 TMU를 탑재한다고 가정했으며, ROP 갯수는 64개인 경우 (현 세대 최상위칩인 Hawaii XT와 동일한 수준) 와 96개로 증가된 경우를 모두 상정해 보았습니다. 먼저 64 ROP 시나리오 하의 성능 예측 결과입니다.

 

 

현 세대 플래그십인 라데온 R9 290X 대비 24%가량 향상된 성능을 보일 것으로 예상됩니다. 20~30%라는 수치는, 경쟁사의 존재를 잊고 보자면 썩 괜찮은 세대간(inter-generation) 진보라 간주될 수도 있겠으나 이미 현 시점에 R9 290X를 능가하는 강력한 경쟁자가 있음을 놓고 볼 때 결코 만족스러운 성능향상이라고만은 할 수 없는 수치이기도 합니다. 편의상 R9 290X의 성능을 앞서 살펴본 엔비디아 테이블에서 90%p쯤에 해당되는 것으로 간주하자면(= GTX TITAN과 GTX 780 Ti의 중간쯤), 위 시나리오 하의 Fiji XT의 성능은 112%p 정도로 환산되며 이는 GM200에는 한참 못 미치지만 아쉬운 대로 GTX 980과는 경쟁할만한 성능이긴 합니다.

 

그렇다면, ROP 갯수가 Hawaii XT보다 증가된 경우는 어떨까요. 아래는 96 ROP 시나리오 하의 성능 예측 결과입니다.

 

 

앞선 시나리오보다 거의 성능향상폭이 두 배로 (+24% vs +48%) 늘었습니다. R9 290X를 지포스 테이블의 90%p로 대입할 경우, 96 ROP Fiji XT의 성능은 134%p 정도로 환산되며, 여전히 GM200보다 느리기는 하지만 GTX 980은 꽤 넉넉한 격차로 제칠 수 있으며, 약간의 클럭 조정을 거친다면 GM200과 리테일 시장에서 직접 경쟁할 수도 있을법해 보입니다.

 

물론 지금까지 계산한 모든 결과는 순수한 성능 예측에 국한된 것으로, 전성비나 면적대비 성능 등의 정보는 전혀 알 수 없는 상황입니다. (그리고 원칙적으로는 유출된 "추정 스펙" 자체의, 정보로써의 신뢰성 역시 어떤 수준으로도 담보할 수 없는 게 사실입니다.) 그러나 차세대 그래픽카드의 정보에 목마른 사람들에게는 또 하나의 재밌는 읽을거리가 되지 않을까... 하는 작은 소망을 안고, 여러 차례의 퇴고를 거쳐 "발행" 버튼을 누르는 바입니다. 부디 즐겁게, 가볍게 읽어 주셨으면 좋겠습니다.

 

긴 글 읽어 주셔서 감사합니다. 좋은 하루 되세요 :-)

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)