본문 바로가기

Benchmark/vga_bench

GPU 아키텍처 대결 : 동클럭 성능 비교

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)

(※ 이 글은 엔비디아/AMD 양사의 과거, 현재, 미래 행보를 짚어보는 <그들은 어디로 가는가> 의 예고편으로 작성되었습니다.)

 

 

 

지금 보여드릴 벤치마크 자료는 현재 엔비디아/AMD 양사의 포트폴리오를 구성하고 있는 현세대 GPU들을 같은 클럭으로 고정해 비교한 것입니다. AMD의 GCN(Graphics Core Next), 엔비디아의 케플러/맥스웰 아키텍처가 적용된 모든 GPU를 망라했으며 각각의 풀스펙 칩뿐 아니라 일부분이 비활성화된 파생 칩까지 비교 대상으로 포함되어 있습니다. 결론을 미리 정리해 보자면 아래와 같습니다.

 

- 현재까지 출시된 것 중 GM200은 단연 최고.

- 먼치킨급인 GM200을 제외하고, GM204 / GK110 / 하와이만 따로 비교하면 셋 중 하와이가 가장 고성능 아키텍처.

 

분명 널리 받아들여진 성능 서열은 GTX 980 > GTX 780 Ti > R9 290X이고 여기에 토를 달 사람은 많지 않을 것입니다. 그러나 이들의 작동속도가 GTX 980은 1.2~1.3GHz, GTX 780 Ti는 928~1020MHz, R9 290X는 727~1000MHz 인 등 각기 다르게 설정되어 있다는 사실에까지는 상대적으로 관심을 덜 가져온 것 역시 사실입니다. 그렇기에 아래의 그래프가 특별한 의미를 가지리라 생각합니다. 비록 시장에서 팔리고 있는 그래픽카드의 속도를 반영하지는 못하나, 이론적으로 어느 아키텍처가 다른 것에 비해 우수한지(?) 따져볼 수 있는 거의 첫 자료일 것이기 때문입니다. 사설은 이쯤에서 끊고, 문제의 그래프를 보시죠.

 

 

위에서 이미 한번 요약했지만, GM200을 제외하고 볼 때 하와이 XT는 현존하는 현세대... 아니, GM200이 나왔으니 전세대라고 해야겠군요. 직전 세대 GPU 중 가장 우수한 동클럭 성능을 보이는 설계라고 할 수 있습니다. 그 뒤를 근소한 차이로 GK110의 풀 칩인 GK110-425/430이 따르고 있습니다. 아시다시피 이 칩은 GTX 타이탄 블랙 및 780 Ti에 사용된 것입니다. 그간 <당신이 놓쳐온 것들> 에서도 몇 차례 짚고 넘어간 바 있는데, 높은 폭으로 오버클럭된 비레퍼런스 GTX 780 Ti들이 GTX 980보다도 높은 성능을 보이곤 했던 이유가 여기 나와 있는 셈입니다. 결국 GTX 타이탄 X가 나온 3월 17일 이전까지만 하더라도 AMD는 세계에서 가장 빠른 단일 GPU의 설계도를 갖고 있던 셈입니다. 비록 GM200의 등장과 함께 현존하는 GPU 중 동클럭 '넘버 투'로 내려앉기는 했으나 여전히 세계에서 두 번째로 빠른 단일 GPU입니다. 적어도 다른 경쟁자들과 동등한 작동 속도를 달성할 수만 있다면 그렇습니다. (소비전력, 발열 등의 문제로 그러기 어렵다는 것이 유일하면서도 결정적인 단점입니다.)

 

GM204의 풀 칩이자 GTX 980에 탑재된 GM204-400은 위에 언급한 것들보다 두세 계단쯤 떨어진 곳에 자리잡고 있습니다. 쿠다코어 갯수로만 따졌을 때, 2304개의 코어를 내장한 GK110-300 (GTX 780에 쓰인 칩) 보다는 성능이 좋으니 확실히 효율이 개선되었단 점은 확인 가능합니다. 다만 2688코어를 탑재한 GK110-400 (GTX TITAN에 쓰인 칩) 보다는 떨어지는 성능을 보이고 있어 쿠다코어 갯수당 효율은 약 20%안팎으로 (정확히는 15% < x < 30%) 향상된 것으로 보입니다. 이 효율에, 배정밀도(DP) 연산유닛을 아예 뿌리뽑아 확보한 소비전력과 발열 유보분을 클럭 상승에 몰빵하고, 여기서 얻은 클럭 상승률을 더해 우리가 알아 오던 '2세대 맥스웰의 성능향상률' 을 얻게 된 것입니다.

 

한편, 위 그래프에서 또다른 몇 가지 흥미로운 사실을 발견할 수 있습니다.

 

- 케플러 아키텍처 내에서 최상위 칩(GK110)의 차상위 칩(GK104)에 대한 상대성능은 약 160%

- 맥스웰 아키텍처 내에서 최상위 칩(GM200)의 차상위 칩(GM204)에 대한 상대성능은 약 146%

- 최상위 칩의 케플러-맥스웰 아키텍처 이행에 따른 성능변화율(GM200/GK110)은 약 138%

- 차상위 칩의 케플러-맥스웰 아키텍처 이행에 따른 성능변화율(GM204/GK104)은 약 151%

 

최근에 목격한 '충격적인 성능향상'이 GM200의 몫이었기에 더 크게 느껴진 것일 수 있겠으나, 어쩄든 수치로 비교하자면 GM200이 가져온 충격보다 과거 GK110이 가져온 충격이 훨씬 더 컸다는 사실입니다. (새삼 과거 타이탄이 얼마나 위압적으로 느껴졌는지 되새겨 봅시다.) 그리고 좀 더 미묘한 부분으로, 항상 우리의 시선이 '최상위 라인업'에 고정되어 있기에 최상위급의 변화폭이 가장 크리라 생각하기 쉽지만 적어도 케플러-맥스웰 세대교체에서만큼은 최상위 칩보다 차상위 칩의 변화폭이 더 컸다는 점을 짚고 가고자 합니다. 그런 면에서 GTX 980의 위상은, 태생적으로 차상위 칩에 뿌리를 두고 있단 점에서, 과거 GTX 780이 담당했던 것이라기보다도 GTX 680의 그것에 더 가까워 보입니다.

 

...더 자세한 내용은, 조만간 완결된 글로 찾아뵙겠습니다 :)

 

(본격_셀프_홍보글.txt)

 

//

 

아래 '밀어주기'는 티스토리의 크라우드펀딩 시스템입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.