본문 바로가기

Lecture & Column/vga_lec_col

TITAN-Z는 엔비디아의 마지막 패가 아니다

Author : Daeguen Lee

(Any action violating either CCL policy or copyright laws is strictly prohibited)




지난 3월 26일, 엔비디아는 GTC 2014 행사에서 전격적으로 지포스 GTX TITAN-Z를 발표했다. 한편, 많은 이들은 엔비디아가 그 자리에서 그들의 차세대 아키텍처인 20nm 기반 맥스웰에 관해 언급할 것이라 예상했지만 재차 예상을 깨고 맥스웰에 관하여는 한마디 언급도 하지 않았다. 그리고 며칠 뒤엔 경쟁사인 AMD가 이로부터 정확히 2주 뒤인 4월 8일 라데온 R9 295X2를 출시할 것이라는 소식이 전해졌다. 이처럼 TITAN-Z의 등장이 예고(만)되고 경쟁사의 ‘신상’ 295X2는 아직 그 사양조차 드러나지 않은 시점에서, 상당 부분 추론에 의거해 엔비디아의 다음 수를 예상해 보고자 한다.


TITAN-Z는 엔비디아의 마지막 패가 아닐 것이다.


TITAN-Z 는 엔비디아가 그들의 현 세대 최고성능 그래픽 프로세서 (GPU) 인 GK110을 두 개 탑재한 것으로, 정확한 사양이 알려지지는 않았으나 엔비디아는 발표자료를 통해 이 제품의 단정밀도 부동소수점 연산성능이 8 테라플롭스임을 밝혔다. 이를 GK110 GPU의 사양에 대입해 역산하면 TITAN-Z에 탑재되는 GK110 두 개는 각각 700MHz를 약간 상회하는 작동 속도를 갖게 될 것으로 추측된다. 이는 현재까지 엔비디아가 발표한 최고 성능 데스크탑용 그래픽카드인 지포스 GTX 780 Ti보다 18% 낮으며, 비교 대상을 비(非) 데스크탑용으로까지 확대할 경우 동일한 GK110 GPU 기반의 지포스 GTX TITAN BLACK보다는 21% 더 느린 것이다.


사실 엔비디아가 GPU를 두 개 탑재한 제품을 당대 최고 성능의 단일 GPU 제품보다 낮은 사양으로 결정한 것이 이번이 처음은 아니다. GTX 295는 GTX 280의 GPU에서 ROP, 메모리 인터페이스 및 작동 속도를 하위 제품인 GTX 260 수준으로 제한하여 두 개를 탑재한 것이었고 GTX 590은 GTX 580과 동일한 GPU를 사용했으나 작동 속도가 GTX 570에도 미치지 못할 만큼 낮춰졌던 바 있다. 마찬가지로 GTX 690 역시 작동 속도를 낮춘 GTX 680의 GPU를 두 개 탑재한 것이다. 이렇다 보니 TITAN BLACK 내지는 GTX 780 Ti보다 낮은 속도로 작동하는 GK110 GPU 두 개로 TITAN-Z를 구성하는 것이 지극히 자연스러운 귀결처럼 보인다. 하지만 이 논리에서 우리가 간과하고 있는 것이 있는데, 그것은 엔비디아가 이들 제품을 발표할 당시 경쟁사인 AMD 제품의 상대적인 성능이다.


지포스 GTX 280과 라데온 HD 4870이 양사의 최상위 제품이던 때, AMD의 4870은 많은 매체로부터 호평을 받고 실제 시장에서도 좋은 반응을 이끌어내는 데 성공했지만 이는 절대성능에서의 우위에서 비롯된 것은 아니었다. 단지 4870이 GTX 280보다 (기실 그 하위 제품이던 GTX 260보다도) 저렴한 가격에 팔리고 있었기에 ‘가격 대비 성능’의 측면에서 어필할 수 있을 따름이었다. 마찬가지로 GTX 590이 출시되던 당시 AMD의 6970은 엔비디아의 GTX 580이 아니라 GTX 570과 경쟁하는 수준이었고, GTX 690의 출시 직전까지 GTX 680은 AMD의 7970 대비 비교우위를 확실히 점하고 있었다. 하지만 양사의 차기 듀얼 GPU 제품들이 예고된 지금의 상황은 지금까지 살펴본 것과는 사뭇 다르다. 현 시점에서 AMD의 최고성능 GPU인 ‘하와이’ 기반 그래픽카드인 라데온 R9 290 / 290X는 엔비디아의 GK110 기반 제품들과 그 어느 때보다도 동등한 절대성능을 무기로 대등한 싸움을 펼치고 있기 때문이다.


더군다나 앞서 기술한 각 상황에서 AMD는 2-GPU 제품에 승부수를 띄우기 위해 외려 최상위 단일 GPU 제품보다도 더 높은 작동속도를 적용하곤 했는데, 이러한 ‘공작’은 심지어 공식 TDP를 실제 소비전력보다 축소해 표기한다는 비난을 감수하면서까지 포기하지 않아 왔던 것이다. 실상 하와이 GPU의 소비전력이 매우 높기는 하나 이를 근거삼아 AMD가 하와이 GPU 두 개를 탑재한 그들의 새 제품을 설계함에 있어 작동속도를 낮출 것으로 예상했다면, 그리고 이 같은 인식이 엔비디아가 TITAN-Z를 설계한 저변에 있었다면 이는 크게 잘못된 것이다. 필자는 아직 295X2의 사양이 공개되지 않았지만 단일 하와이 GPU 그래픽카드인 290 / 290X와 최소한 같은 작동속도를 갖게 될 것으로 추측한다. 간단히 말해, 295X2는 TITAN-Z보다 압도적으로 빠를 것이다. 그렇다면, 엔비디아가 적어도 이 글과 같은 전략적 판단을 거쳐 TITAN-Z의 사양을 결정했다면 TITAN-Z가 겨냥한 것은 295X2가 아닌 다른 무엇이라는 결론에 도달한다. 그것이 무엇인지 알기 위해서는 GTC 2014 이전으로 시계를 되돌려 볼 필요가 있다. 마침 양사의 타임라인을 통틀어 이 시점 이전에 도래한 가장 가까운 사건은 3월 18일의 하와이 GPU 기반 FirePro (이후 FirePro W9100라는 이름으로 공식 발표된다.) 의 유출이었다.


FirePro W9100은 하와이 GPU에 기반한 AMD의 워크스테이션용 제품으로, AMD의 발표자료에 따르면 5 테라플롭스의 단정밀도 연산성능과 2 테라플롭스 “이상”의 배정밀도 연산성능을 갖는다고 기술되어 있다. 여기서 배정밀도 연산성능은 5 테라플롭스의 절반인 2.5 테라플롭스로 추측되는데, 이는 데스크탑용 제품에 적용되는 하와이 GPU의 그것보다 네 배 향상된 것이다. (소수점 이하를 생략한 것은 마케팅상 메세지의 단순화를 위해서일 것이다.) 이 제품이 데스크탑 영역의 형제뻘인 290X와 동일한 작동 속도를 갖는 경우 이론적인 배정밀도 연산성능은 2.8 테라플롭스에 달하나, 여분의 배정밀도 연산장치가 활성화되며 늘어난 소비전력 등을 고려해 작동 속도를 다소 낮춰 최종적으로 2.5 테라플롭스를 얻어 낸 것으로 이해된다. 이는 앞서 세운 가설과 맞물려 많은 점을 시사하는데, 가설과의 가장 직관적인 연결고리는 바로 GK110 GPU의 단정밀도 및 배정밀도 연산장치의 구성비에 있다. 널리 알려졌다시피 이 비율은 3:1로, 다시 말해 8 테라플롭스의 단정밀도 연산성능을 갖는 TITAN-Z는 그 3분의 1에 해당하는 2.6 테라플롭스의 배정밀도 연산성능을 가지며, 공교롭게도 이 2.6이라는 숫자는 마치 끼워 맞춘 듯 FirePro W9100의 그것을 간신히 넘어서는 것이다. 즉, 여기서부터 TITAN-Z가 겨냥한 것은 애초 295X2가 아니라 FirePro W9100이라는 가설이 세워진다.


한편, 시계를 좀 더 뒤로 돌려 보면 엔비디아가 AMD ‘베수비오’ (295X2라는 이름이 확정되기 전까지 이 제품을 가리키던 코드명이다.) 의 대항마로 GK110 GPU를 두 개 탑재한 GTX 790을 준비하고 있다는 소식이 발견되는데, 이는 우리의 가설을 보다 설득력 있게 뒷받침해 주는 정황증거이다. 애초 TITAN-Z와 GTX 790이 서로 다른 과녁을 겨냥하여 별도로 추진돼 왔다는 것은 지포스 GTX TITAN - GTX 780 - GTX 780 Ti - GTX TITAN BLACK으로 이어지는 일련의 흐름으로 “TITAN”과 (통상적인) “지포스” 브랜드의 별개성을 증명한 역사와 일맥상통하기 때문이다. 다시 말해, 처음부터 TITAN-Z의 경쟁 상대는 FirePro W9100였고, 그렇기에 295X2가 TITAN-Z보다 압도적으로 우수한 게임 성능을 보이리라는 어떤 전망도 사실 TITAN-Z에게는 (나아가 엔비디아에게는) 별다른 동요를 일으키지 못하는 것이다. 이 가설이 맞다면, 295X2가 상대해야 할 진정한 경쟁자는 이미 알려진 TITAN-Z가 아니라 아직까지 베일에 싸인 GTX 790이 될 것이다.


혹시라도 지금까지의 전개에 회의를 가질 독자들을 위해 쐐기를 박자면, TITAN-Z는 8 테라플롭스에 해당하는 작동 속도를 가지고는 죽었다 깨어나도 295X2를 상대할 수 없다. 그래픽카드의 성능을 결정짓는 요소를 크게 대별하면 '연산', '질감 처리' 및 '그리기' 의 세 영역으로 나뉘는데, 이 중 '그리기'를 담당하는 렌더링 파이프라인 (ROP) 의 갯수가 하와이는 64개, GK110은 48개로 하와이 GPU에 더 많은 반면 '질감 처리'를 담당하는 텍스처 매핑 유닛 (TMU) 은 하와이에 176개, GK110에 240개로 GK110쪽이 압도적으로 더 많다. 결국 승부는 연산성능에 달렸는데 이것을 결정하는 연산장치의 갯수는 하와이가 2816개, GK110이 2880개로 갯수만으로 우열을 가리기는 어려워 결국 작동 속도의 대결로 귀결되는 상황이다. 연산성능만을 따지더라도 11 테라플롭스가 넘을 295X2를 대적하기 위해 8 테라플롭스로 '낮춘' TITAN-Z를 내보내는 것은 자살과도 같다.


나아가 아직까지 공식화되지 않은 GTX 790의 존재를 상정하고 볼 때 우리는 엔비디아의 최근 일련의 행보를 더 설득력 있게 받아들일 수 있다. 인과의 선후가 어떻게 된 것이든, 20nm 맥스웰에 대해 GTC 2014에서 일언반구가 없었던 점 (이후 엔비디아는 동 GPU의 등장이 2015년으로 연기될 것이라 공식화한 바 있다.) 과, 만약 출시된다면 새로운 최고 성능 제품이 될 것이 자명한 GTX 790의 등장은 밀접하게 이어져 있을 수밖에 없기 때문이다. 20nm 공정으로의 이행이 늦어져 그 사이를 메꿀 새 리더십이 필요해진 것이거나, 반대로 새 왕좌를 차지할 제품에 최소한의 치세를 보장하기 위한 것, 어느 쪽이든 가설들이 가리키는 손가락 끝은 TITAN-Z 이후의 그 무언가를 가리키고 있다.


단언하건대, TITAN-Z는 엔비디아의 마지막 패가 아니다.