본문 바로가기

Lecture & Column/vga_lec_col

2세대 맥스웰 (GM204 : GTX 870/880) 성능 예측

Author : Daeguen Lee

(Any action violating either CCL policy or copyright laws is strictly prohibited)




어제의 Tonga 예측에 이어 이틀 연속 예측 2연타를 날리게 됐습니다. 오늘은 아마 모든 분들이 궁금해하실 2세대 맥스웰, 바로 지포스 GTX 880 / 870의 성능을 예측해 보고자 합니다. 우선 이 글의 영감이 된 WCCFTech 발 기사 (Coolarer.com의 자료를 인용한) 를 아래 링크로 첨부합니다.


http://bit.ly/1mEkbfH


그런데, 위 기사에 등장한 스펙시트의 "숫자"를 그대로 그래픽카드 성능 방정식에 대입할 수는 없습니다. (아니... 뭐... 대입이야 할 수 있겠지만, 그렇게 해서 얻은 결과가 의미가 없단 뜻이죠) 이유인즉 페르미, 케플러까지 비교적 잘 맞아 오던 방정식이 맥스웰의 등장과 함께 무너져 버렸기 때문입니다. 어차피 장기적으로 보아 이런 보정이 필요한 시점이 되었기도 해서, 오늘은 성능 예측과 함께 방정식을 보정하기 위한 아이디어를 얻는 과정을 간단히 소개하고자 합니다.


아래의 표에는 최근 3개 세대에 걸친 엔비디아의 그래픽카드들이 망라되어 있습니다. 특히 저 중에서 GTX 570, GTX 650 Ti Boost, 그리고 GTX 750 Ti는 수년간의 진화를 거쳐 동일한 성능이 어떻게 하이엔드 - 퍼포먼스 - 메인스트림까지 뻗어 내려오는지를 생생하게 증명하는 실례라고 할 수 있겠는데, 실제로 이들 셋의 성능은 여러 테스트 결과를 종합하면 거의 같은 수준으로 수렴하기도 합니다. 때마침 페르미 / 케플러 / 맥스웰의 각기 다른 아키텍처를 차용한 이들은 오늘의 아키텍처간 (inter-architectural) 분석에 있어 핵심적인 역할을 맡게 됩니다.



일단 각기 페르미와 케플러 진영을 대표하는 GTX 570과 GTX 650 Ti Boost는 아키텍처의 차이에 불구, 방정식에 각종 수치를 있는 그대로 대입했을 때 실제 성능관계와 비슷한 점수를 얻음을 알 수 있겠습니다. 그러나 맥스웰로 옮겨가면 이야기가 조금 달라집니다. 보시다시피 GTX 750 Ti나 GTX 750은 각각 동급(정확히는 각각 백중열세/백중우세)으로 평가받는 GTX 650 Ti Boost / GTX 650 Ti와의 비교에서 하나같이 떨어지는 모습을 보이고 있는데, 이는 맥스웰이 소위 '숫자로 어필하는' 스펙의 강화보다는 '있는 자원의 효율적인 사용', 즉 최적화에 극도로 애를 쓴 아키텍처란 점과 일맥상통합니다. 실제 맥스웰은 외견상 초라해 보이는 SP/TMU/ROP 갯수 등에 불구하고, 스트리밍 멀티프로세서(SM)의 재구성과 대용량 캐시메모리 도입 등을 통해 적은 연산유닛의 효율적인 활용과 좁은 메모리 대역폭의 완충 등을 이뤄낸 바 있습니다. 그렇다면 우리가 알아봐야 할 것은 과연 '어느 비율로' 효율이 증가했느냐는 점이겠죠.


여기서부터는 접근 방법이 그리 세련되어 보이지 않겠지만 이렇게 가 보도록 합시다 : 맥스웰의 연산유닛 효용이 증가한 것은 분명하나 우리는 그것이 SP 차원인지, TMU 차원인지 또는 ROP 차원인지 알 수 없습니다. 모든 방면에서 공평하게 효율이 증대되었다고 가정하고, 현재 표에 입력된 맥스웰 계열 GPU들의 스펙에서 SP/TMU/ROP 갯수에 관한 항을 일정한 비율로 증가시켜 볼 것입니다. 그렇게 하여 GTX 570 / GTX 650 Ti Boost와 비슷한 수준에 도달한 시점까지 취해진 '비율'을 맥스웰의 증대된 효율... 편의상 '맥스웰 계수' 등으로 이름붙여 볼 수 있겠죠. 마침 GTX 650 Ti Boost가 100%로, GTX 570이 94%로 되어 있으니 94~100% 사이의 어딘가로 들어오는 시점을 눈에 불을 켜고 찾아보시기 바랍니다. 아래는 실험 결과입니다.


(편의상 각 유닛 갯수에 10%씩을 증감시켜 가며 이론상 성능의 향상 정도를 점검했습니다.)






1.4배의 배율이 적용되었을 때 GTX 750 Ti의 이론상 성능이 GTX 570과 GTX 650 Ti Boost의 사이로 들어와 실제 성능관계와 비슷한 서열이 되었습니다. GPU 내부에서 전반적으로 30~40% 정도의 효율 개선이 일어났다고 보면 틀리지 않을 것 같습니다. 다시 말해, 위의 과정을 통해 우리는 간단히 "맥스웰을 위한 보정계수" 를 얻었습니다. 그렇다면 이제부터가 진짜 본론. 얻어낸 '맥스웰 계수'를 통해 현재까지 알려진 (가장 그럴듯해 보이는) 맥스웰의 스펙을 바탕으로, 다가올 GTX 880 / 870의 성능을 계산해 보겠습니다. 아! 신난다!!!!!



Trial 1 : GeForce GTX 870



일단 "있는 그대로" 숫자를 대입해본 결과는 이미 예상 가능하듯 자못 실망스러운 수준입니다. 타이탄은커녕 GTX 780보다도 떨어지고, GTX 680을 겨우 넘어서는 성능으로 870이라는 숫자를 붙이기는 조금 민망하죠. 그렇지만 맥스웰 계수를 곱해주면 어떻게 될까요.



보시다시피 GTX 780과 780 Ti의 사이쯤으로 예상 성능이 올랐습니다. 특히 GTX 780에 비교할 만하다는 점에서 많은 점을 시사하는데, 본 글이 쓰여진 배경이기도 한 Coolarer.com발 자료의 3DMark 점수를 보면 실제로 (GTX 870으로 추정되는 그래픽카드의 점수가) GTX 780과 비슷하거나 살짝 더 높은 수치를 가리키고 있기 때문입니다. 다시 한번, 글 도입부에서의 간단한 계산 실험만으로 얻어낸 아주 러프한 '맥스웰 계수'가 놀랍도록 정상적으로 작동함을 확인할 수 있겠습니다.


한편, GTX 870의 스펙으로 제시된 것은 아래와 같습니다. (이미 표에 다 드러났지만-_-;; 새삼스레)


GTX 870 (GM204) : 1664 CUDA Cores / 104 TMUs / 32 ROPs / 256bit GDDR5 IMC


여기서 1664, 104라는 숫자가 매우 생소한데, GTX 750 / 750 Ti에 쓰인 GM107의 내부구조에 근거해 하나의 SM에 해당하는 128 CUDA Cores / 8 TMUs로 각각의 숫자를 나눠 주면 GTX 870에는 13개의 SM이 탑재되어 있단 사실을 알 수 있습니다. 직관적으로 생각했을 때 15개 정도의 SM 중에서 2개를 비활성화해 하위 모델인 GTX 870을 파생시켰다고 보는 편이 자연스럽기에, GM204 GPU를 쓴 플래그십이 될 GTX 880은 15개의 SM을 쓰게 될 가능성이 높아 보입니다. (혹은 초창기 GTX 480, 또는 GTX TITAN의 예처럼 수율확보를 위해 한개쯤 비활성화할 가능성도 있겠습니다만...) 이 경우 GTX 880의 스펙은 아래와 같게 됩니다.


GTX 880 (GM204) : 1920 CUDA Cores / 120 TMUs / 32 ROPs / 256bit GDDR5 IMC


백문이 불여일견. 바로 표에 대입해 보겠습니다. 일단 첫번째 표는 숫자를 "있는 그대로" 대입한 것입니다.



Trial 2 : GeForce GTX 880



굉장히 안쓰러운 성능이 나왔지만 이미 우리에겐 이 숫자들은 아무 의미 없습니다. 맥스웰 계수 출동!!



보정 후 GTX 880은 GTX 780 Ti를 넘어설 것으로 예측되었습니다. 사실 어찌 보면 너무 당연한 결과 같기도 하고, 어떤 면에서는 기대에 못 미치는 모습이라고도 할 수 있겠는데 애초 GM204라는 GPU 자체가 2세대 맥스웰 중 (최상위급이 아닌) 차상위급 실리콘이라는 점과, 현 제조공정 하에서의 맥스웰이 갖는 의의가 절대성능의 폭발적인 향상이라기보다는 적은 자원의 효율적 활용, 다시 말해 전성비의 증대에 있는 만큼 저 정도의 성능을 선보이는 것이 '적당히' 합리적이라는 생각도 듭니다. 달리 생각하면 GTX 780 Ti를 뛰어넘는 성능을 구현하는 데 들어간 유닛 수가 GK104(= 1536/128/32)보다 조금 많은 정도에 그쳤으니, 기존의 GTX 680 이하의 소비전력에 GTX 780 Ti 이상의 성능의 조합이 되는 것도 불가능하지 않을 것이고 그렇다면 그것만으로 꽤 매력적인 제품이 되지 않을까... 개인적으로는 대충 이런 생각입니다.


얼른 GM200의 스펙도 공개되면 좋겠습니다. GTX TITAN II는 과연 어떤 절대성능을 보여줄까요.


...여기까지입니다. 긴 글 읽어 주셔서 감사하고, 좋은 하루 되세요~ :)


//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)