AMD 라데온 R9 290X 리뷰

글쓴이 : 이대근

연락처 : leedaeguen [at] kaist.ac.kr

(이 블로그의 CCL 정책에 위배되는 무단전재 및 재배포를 금지합니다)





애초 예정되었던 9월 25일, 10월 8일을 거쳐 드디어 지난 10월 24일 "라데온 R9 290X" 에 대한 NDA(non-disclosure agreement, 보도유예)가 풀렸습니다. 그간 사실과 루머가 뒤섞인 채 많은 분들의 궁금증을 키워만 갔던 코드네임 'Hawaii'가 바로 이 제품입니다. 거두절미하고, 제가 작성했던 지금까지의 어느 리뷰들보다도 자세하고 방대한 분석을 통해 R9 290X의 모든 것을 지금 이 자리에서 까발려 드리려 합니다. 준비 되셨나요?


※ 한달여 전 (R9 290X라는 네이밍이 확정되기도 전) Hawaii-XT 엔지니어링 샘플 카드를 리뷰한 바 있는데, 그때와 지금 어떤 차이가 있는지 비교해 보는 것도 재미있을 것 같습니다. 해당 리뷰는 다음 링크에서 보실 수 있습니다. 참고로 당시의 테스트 설정 중 2560 x 1600 해상도는 2560 x 1440을 잘못 표기한 것으로, 이 자리를 빌어 정정합니다.


AMD Hawaii-XT Engineering Sample Review


R9 290X는 AMD가 전작인 라데온 HD 7970을 출시한 지 1년 9개월만에 새로 선보이는 플래그십 제품입니다. 이들은 GCN이라는 아키텍처를 공유하며 각기 '볼캐닉 아일랜드' 시리즈와 '서던 아일랜드' 시리즈를 대표하는 위치에 있습니다. GCN의 등장 및 볼캐닉 아일랜드의 출시가 갖는 의미는 그간의 R 시리즈 리뷰에서 장황하게 서술한 바 있는데, 아래 링크들을 참조하시기 바랍니다.


(앞의 글)

AMD Radeon R9 280X / R9 270X / R7 260X Review



한편, R9 290X에 탑재된 Hawaii-XT GPU의 스펙에 관해서는 아래의 보도자료에 잘 요약되어 있습니다.




스펙에 관하여, 공교롭게도 정식으로 정보를 전달받기 전인 <AMD Radeon R9 280X / R9 270X / R7 260X Review> 작성 당시 이를 거의 정확하게 예측해낸 바 있는데, 이에 관해 해당 리뷰에서의 내용을 인용해 보겠습니다. 스펙 예측에 관해서는 그래픽카드 성능 방정식에 관한 종전의 글을 참고해 주셔도 좋을 것 같습니다.


GTX TITAN ULTRA vs Radeon R9 290X : 그래픽카드 성능 방정식을 이용한 성능 예측


"AMD가 GCN을 발표하기 전까지 사용하던 아키텍처는 Very Long Instruction Word-4, 줄여서 VLIW4라 불리던 것이었습니다. 6970, 6950 등 GCN 이전까지의 하이엔드 GPU에 적용된 아키텍처이기도 했죠. 그 전 세대인 5800 시리즈는 VLIW5 아키텍처를 사용했는데, 여기서 VLIW란 하나의 ('very long' 한...) 명령어 이슈 포트에 4개 또는 5개의 연산 유닛(SP)이 붙어 있음을 의미합니다. 이론적으로 GPU의 최고 성능은 물론 SP의 절대량에 비례하지만, 4~5개의 SP가 한 묶음으로 되어 있는 구조 하에서 실제로 모든 SP가 빈둥거리지 않고 일을 하도록 만들기란 매우 어렵습니다. (하나의 '큰 명령어'가 내부적으로 4개 또는 5개의 '작은 명령어'로 환원되어 각각의 SP에 할당되는 구조로 이는 필연적으로 '큰 명령어'의 설계 당시부터 이를 고려할 것을 필요로 합니다.) 실제로 VLIW 아키텍처 하에서 라데온의 SP갯수 대비 성능은 그리 높은 편이 아니었는데, 아주 단순하게는 라데온들이 SP 갯수가 훨씬 적은 지포스들과 같은 성능군을 형성했던 예를 들 수 있겠습니다. 어쨌든 GCN의 도입을 통해 AMD는 VLIW의 약점을 상당히 개선하게 됩니다.


(중략) 어쨌든 GCN 아키텍처 하에서 개별 SP의 연산 효율성은 기존의 VLIW 시절에 비해 많이 향상된 편이고, 간단히 요약하자면 기존보다 적은 수의 SP로도 얼마든지 기존보다 고성능의 그래픽카드를 만드는 것이 가능해졌습니다. SP 갯수가 896개에 불과한 7790이 1440SP인 5850과 비슷한 성능을 갖는 것이라든지, 1024SP의 7850이 1600SP인 5870보다 성능이 좋은 것은 바로 이 때문에 가능합니다.


이런 GCN의 정점에 있는 GPU가 바로 'Tahiti' (타히티)입니다. 하나의 타히티 GPU는 2048개의 SP, 128개의 TMU, 384bit GDDR5 메모리컨트롤러를 가짐으로써 전세대 플래그십인 6970 대비 1.3배의 SP/TMU, 1.5배의 메모리 대역폭을 갖게 되었지만 그래픽카드의 성능을 결정짓는 또 하나의 중요한 요소인 ROP 는 그대로 32개인채로 남아 있습니다. 이로 인해 타히티는, 비록 7970이 6970을 압도적으로 이기는 데까지는 성공했지만, 실은 오히려 아직까지도 제 성능을 다 발휘하지 못하고 있는 셈입니다.


다시, 타히티의 출시로부터 거의 2년 - 정확히는 1년 10개월만에 AMD는 '볼캐닉 아일랜드' 시리즈라는 새로운 이름의 라데온들을 선보이려 하고 있습니다. 현재까지 떠도는 루머들과 알려진 스펙을 종합해 볼 때, 볼캐닉 아일랜드의 플래그십인 'Hawaii' (하와이) GPU는 2816개의 SP와 176개의 TMU, 512bit GDDR5 메모리컨트롤러를 갖는 것이 거의 확실해 보이지만 유일하게 베일이 벗겨지지 않은 부분이 바로 하와이의 렌더링 백엔드에 관련된 부분입니다. 그러나 하와이의 픽셀 필레이트 성능이 7970 대비 두배에 달하는 것으로 알려진 것으로 미루어 볼 때, 하와이는 지금까지의 어떤 데스크탑용 GPU보다도 넓은 ROP를 가졌을 것으로 짐작됩니다. (루머로 떠도는 44개설, 48개설이 아닌...) 구체적으로는 7970의 두 배인 64개의 ROP를 가졌을 것으로 예상해 보겠습니다. 즉, 앞서 타히티가 6970 대비 스펙상의 많은 향상을 이뤘지만 ROP만큼은 정체되어 있었다고 언급한 바 있는데, 이번의 업그레이드를 통해 AMD는 GCN 아키텍처의 완전한 '포텐셜'을 터뜨리려는 것으로 보입니다."


서론은 이쯤에서 마치고, 본격적으로 본론으로 들어가 보겠습니다. 우선 테스트에 사용된 시스템 사양입니다.



테스트에 사용된 프로그램 목록은 아래와 같습니다.



그동안 늘 이쯤에서 끝내곤 했던 테스트 설정 파트를 오늘은 보다 자세히 적어 보려 합니다. 좋은 리뷰란 정확한 정보를 취합해 편집자의 주관을 배제하고 최대한 객관화해 이를 독자들에게 제공하는 것뿐 아니라 '재현 가능성'의 여지를 열어 둠으로써 상시적으로 개선의 여지를 남겨두는 것까지라고 생각하며, 여기서 핵심인 '재현 가능성'은 테스트에 사용한 자원의 측면에서뿐만 아니라 테스트를 수행하는 자체에 녹아 있는 노하우, 방법론에 이르기까지 모든 정보를 독자들과 공유할 때 가능한 것이기 때문입니다.


1. 프레임 측정 (Measuring framerate)


이 리뷰에서 '초당 프레임 수' 단위로 나타내어지는 것은 3D 게임 성능 및 UNIGINE Valley 벤치마크 결과입니다. (정확한 목록은 위 표를 참조하시기 바랍니다) 이들 중 자체적인 벤치마크 툴이 있는 경우는 해당 툴을 그대로 사용했으며, 없는 경우는 제가 직접 프레임 측정을 병행하며 테스트를 진행했는데 공통적으로 적용되는 방법론은 아래와 같습니다.


- FRAPS 실행, 백그라운드에 띄운 후 3D 게임 실행

- 테스트 구간 진입, F11키를 눌러 프레임레이트 레코드 시작, 테스트 구간 플레이

- 테스트 구간 종료, F11키를 눌러 레코드 종료

- 이상의 과정을 3회 반복. 테스트 종료 후 최소/최대값을 제외하고 중간값 취득


참 쉽죠?


2. 프레임 지연시간 측정 (Measuring frametime)


위에 열거한 3D 게임 / 벤치마크 툴들 중 자체적으로 벤치마크를 진행할 수 있는 경우라도 프레임 지연시간을 나타내 주는 것은 하나도 없습니다. 흔히 그래픽카드 성능의 척도로 삼는 '평균 초당 프레임 수'로는 감지할 수 없는 체감 성능상의 요소들은 분석하기 매우 어려운 부분 중 하나인데, 대표적인 것이 '게임 중 뚝뚝 끊기는 현상'입니다. 이를 설명하기 위해 역사적으로(-_-;) 많은 리뷰어/벤치마크 사이트들은 '최소 초당 프레임 수', 줄여서 '최소 프레임'을 함께 제시하는 방법을 취해 왔는데, 사실 최소 프레임이란 1초씩을 단위로 끊어 가며 테스트가 진행되는 동안의 수많은 '1초들' 중 <가장 적은 프레임을 생성한 1초> 간의 프레임 수를 나타낼 뿐입니다. 즉 이 수치들도 (간접적인 증거는 될 수 있으나) 특정 게임이 높은 평균 프레임에도 불구하고 뚝뚝 끊기는 것처럼 느껴지는 현상을 명쾌하게 설명할 수는 없는 것이죠. 하지만 프레임 지연시간은 하나의 프레임이 그려지는 데 걸리는 시간을 나타내는 값으로, 이 수치는 직접적으로 '뚝뚝 끊기는' 현상을 설명해 줍니다. 이에 이번 리뷰에서는 (그리고 앞으로의 리뷰에서도) 프레임 지연시간 분석을 별도의 챕터로 할애하여 다룰 예정이며, 그 측정 방법은 아래와 같습니다.


- FRAPS 실행, 백그라운드에 띄운 후 3D 게임 실행

- 테스트 구간 진입, F11키를 눌러 프레임 지연시간 레코드 시작, 테스트 구간 플레이

- 테스트 구간 종료, F11키를 눌러 레코드 종료

- 이상의 과정을 3회 반복.

- 측정된 (3개의) 프레임 지연시간의 평균(average), 95 퍼센타일 및 분산(variance)값 계산

- 3개의 평균/95 퍼센타일/분산값의 평균값 취득


하나의 프레임에 대한 프레임 지연시간값은 보통 밀리세컨드(ms, 1천분의 1초) 단위로 주어집니다. 특정 순번의 프레임이 이전 순번의 프레임보다 10ms 이후에 기록되었다면 해당 프레임을 그리는 데 10ms의 시간이 소요되었다는 뜻으로, 이론적으로 모든 프레임에 걸쳐 지연시간값이 10ms라면 해당 테스트 구간에서의 초당 프레임 수는 그 역수인 100프레임/초가 됩니다.


위에서 평균값 / 95 퍼센타일값 / 분산값이라는 세 가지 수치를 언급했는데, 각각이 의미하는 바는 아래와 같습니다.


(1) 평균값 : 모든 프레임을 그리는 데 평균적으로 소요된 시간을 의미합니다. 이 값의 역수는 이론적으로는 테스트 구간 내의 평균 초당 프레임 수와 가까워져야 하지만 완전히 같지는 않습니다. (평균의 역수와 역수의 평균의 관계를 생각해 보시면...)


(2) 95 퍼센타일값 : 모든 프레임을 그리는 데 소요된 각각의 지연시간들을 시간이 짧게 걸린 순으로 나열했을 때, 하위 95% 지점에 해당되는 지연시간 값을 의미합니다. 쉽게 얘기하자면 이 값이 주어졌을 때, 95%의 프레임들은 이보다 짧은 시간에 그려졌다고 보시면 됩니다. 즉 흔히 말하는 '최소 프레임' 개념에 해당하는 값입니다.


(3) 분산값 : 지연시간 분석의 핵심이라고 봐도 과언이 아닌 수치입니다. 이론적으로, 평균값이 10ms로 동일한 상황이더라도 시종일관 10ms를 꾸준히 유지하는 경우와 매 프레임마다 5ms -> 15ms -> 5ms -> 15ms를 오가는 경우가 있을 수 있는데, 단순히 평균을 취하면 10ms로 같아지지만 분산값은 후자가 압도적으로 크게 나옵니다. 분산값의 산술적인 의미는 '각각의 값이 평균으로부터 멀리 떨어져 있는' 정도를 나타내는 것으로, 분산값이 작을수록 해당 그래픽카드가 안정적으로 프레임을 그려내는 것이라고 볼 수 있습니다. 여담이지만 '크로스파이어를 했더니 뚝뚝 끊겨요' 라는 상황의 99.9%가 바로 이러한 불규칙적인 지연시간 때문에 발생하는 것이고, 따라서 분산값의 양상을 관찰하는 것도 매우 의미있는 분석이 됩니다.


이상의 내용 중 잘 이해되지 않는 부분이 있으시다면 (어려워 마시고!) 직접 문의해 주시기 바랍니다.


3. GPU 클럭 측정 (Measuring GPU Clock)


한세대 전만 해도 GPU 클럭이 다이나믹하게 움직이는 것은 풀로드 / 아이들을 기준으로 큰 틀에서만 가능한 일이었지만, 오늘날의 GPU들은 -똑같은 풀로드 상황이라도- 현재 자신이 처한 온도, 소비전력 등의 조건을 종합적으로 '판단'해 추가적으로 클럭을 올리거나 내리는 등의 작동이 가능하게 되었습니다. 좋게 생각하면 늘 최적의 온도/성능/소비전력 조합을 유지할 수 있게 된 것이지만, 테스트를 하는 입장에서는 (특히 변인통제가 절실히 요구되는 성능 비교 테스트 등에서는) 끔찍하게 싫어하는 기능이기도 합니다. 어쨌든 성능은 알아야겠고, 특정 게임(또는 벤치마크)을 구동할 때 GPU의 작동속도를 알아야 분석이 가능하겠기에 GPU 클럭 측정도 병행합니다. 방법은 아래와 같습니다.


- MSI 애프터버너 실행, 백그라운드에 띄운 후 3D 게임 실행

- 테스트 후 애프터버너 종료, 기록 파일 백업, 다시 애프터버너 실행 후 테스트 재개

- 이상의 과정을 3회 반복.

- 측정된 (3개의) 기록 파일을 엑셀로 로드, 평균값 취득


4. 대전제


이상의 방법들을 통해 성능 분석에 필요한 자료를 충분히 얻으실 수 있으리라 믿습니다. 여기서 소개할 것은 저희가 상기 테스트들을 진행한 '환경', 즉 테스트의 대전제들입니다.


- 게임 테스트시 해상도/안티알리아싱을 제외한 모든 옵션은 설정 가능한 최상의 값을 기본으로 함

- 소비전력, 프레임 지연시간 측정은 1920 x 1080 해상도 / 안티알리아싱 미적용시를 기준으로 함

- 모든 테스트에 걸쳐 백그라운드 어플리케이션은 띄우지 않는 것을 원칙으로 함.


이상의 4가지 방법론을 통해 저희는 -다음 장부터 소개해 드릴- 결과들을 얻었습니다. 위에 언급한 부분 외에 결과의 취득에 관해 궁금한 부분이 있거나, 분석 방법 / 결론에의 접근 방법... 기타 모든 측면에서 "리뷰에 관한 의문" 이 생기시는 경우라면 언제든 어려워 말고 연락해 주시기 바랍니다. 여러분의 피드백이 더욱 양질의 리뷰를 생산하는 거름이 됩니다. ^_^


글이 길어 지루하셨죠. 이제부터 그래프의 향연이 펼쳐집니다!

첫번째 주자는 가장 널리 사용되는 3D 벤치마크 툴인 Futuremark사의 3DMark 11입니다.




▲ 오늘의 주인공 R9 290X는 퍼포먼스 프리셋에서는 GTX 690과 GTX TITAN 사이, 익스트림 프리셋에서는 한칸 내려가 GTX TITAN과 GTX 780 사이의 성능을 보여주고 있습니다. 자사의 전세대 플래그십인 7970 GHz Ed.과 사실상 동일한 R9 280X와는 약 20% 정도의 성능 차를 보이고 있습니다.



 이 테스트에서 R9 290X의 소비전력은 GTX 780과 거의 비슷하게 나타납니다.


다음으로 보실 것은 가장 최신 버전의 3DMark에서의 3DMark Fire Strike 테스트 결과입니다.




▲ 앞서 살펴본 3DMark 11과는 달리, 기본 설정과 익스트림 모두 R9 290X가 GTX TITAN을 앞서고 있습니다. 이로써 단일 GPU 카드로서는 가장 높은 성능을 기록했으나, 기존의 듀얼 GPU 카드인 GTX 690 / HD 7990을 넘어서지는 못하고 있습니다. R9 290X는 GTX TITAN보다는 약 2~4% 앞서며, 같은 가격대에서 경쟁할 것으로 여겨지는 GTX 780보다는 10~15% 가량 더 높은 성능을 보입니다.



▲ R9 290X의 소비전력은 앞선 테스트보다 다소 올라 GTX TITAN을 넘어섰습니다.


DirectX 11이라는 API가 처음으로 대중화되고, 이를 기반으로 하는 여러 그래픽 요소들의 성능을 측정할 벤치마크 툴로 처음 세상에 등장한 것이 Heaven 벤치마크 툴이라는 프로그램이었습니다. 많은 분들이 한번쯤 돌려 보셨을 것이라 짐작되는데, 이제부터 결과를 보여드릴 Valley 벤치마크 툴은 바로 Heaven의 제작사인 UNIGINE에서 가장 최근 출시한 새로운 DX11 벤치마크 툴입니다.




▲ 과거 Heaven이 출시되었을 때의 상황을 간단히 짚고 넘어가자면, 라데온 HD 5800 시리즈가 매우 높은 절대성능과 전력대 성능비를 무기로 하이엔드 그래픽카드 시장을 장악한 반면 6개월이나 늦게 등장한 지포스 GTX 400 시리즈는 엄청난 소비전력이 부각되어 본연의 고성능조차 묻혀버릴 만큼 강력한 비토를 받던 상황이었습니다. 이때 DX11의 핵심적인 요소 중 하나인 테셀레이션 성능을 Heaven이 매우 시각적으로 표현해 사람들의 관심을 끌었고, 바로 여기서 GTX 400 시리즈의 비교우위가 부각되며 서서히 (여전히 높은 소비전력으로 인한 원성이 자자했지만) '진짜 DX11 지원 카드' 라는 이미지를 심어주게 됩니다. 간단히 말해 Heaven 벤치마크에서 라데온들은 성능이 그닥 좋지 못했는데, Valley 벤치마크에서도 그 양상은 비슷하게 이어지는 것 같습니다. 여기서는 R9 290X가 GTX 780보다도 떨어지는 성능을 보이고 있습니다.


일단 단일 모니터 환경에서 사용할법한 '평범한 해상도'에서의 성능은 이러했고, 아래는 3 x 1 서라운드 디스플레이 환경에서의 테스트 결과입니다. (AMD는 아이피니티, 엔비디아는 서라운드비전을 각각 적용했습니다)



▲ 여기에서도 여전히 GTX TITAN / GTX 780 형제가 우세를 보입니다.


여담이지만, 서라운드 디스플레이를 구성함에 있어서 상대적으로 높은 아이피니티의 인지도만 믿고 덤볐다가 수많은 자잘한 어려움 (f**king catalyst...) 을 겪은 반면, 엔비디아의 서라운드비전을 통한 구성은 놀랍게도 아무란 자잘한 문제 없이 단 한번의 부팅으로 설정이 가능해 마음을 확 끌었습니다.


음... 그러니까, 뭐 그렇다고요.

 

아래는 울트라 HD로 불리는 4K 해상도에서의 벤치마크 결과입니다. Valley 벤치마크 툴은 네이티브하게 이 해상도를 지원하지는 않기 때문에 Custom 모드로 직접 해상도를 입력해 테스트를 진행했습니다.



▲ 서라운드 디스플레이일 때의 결과와는 달리 듀얼 GPU 카드들이 다시 치고 올라온 것이 눈에 띕니다.

여기서도 R9 290X의 성능은 GTX 780과 비슷하며, GTX TITAN보다는 떨어지는 성능입니다.



▲ 이번 테스트부터는 테스트를 진행한 해상도/안티알리아싱별 조합이 많아 그래프가 좀 많은데, 한눈에 성능 변화 양상을 보실 수 있도록 꺾은선그래프를 하나 추가해 보았습니다. (앞으로 '성능 추세 그래프' 또는 '성능 추세선'이라 하겠습니다) 각 그래픽카드별로 고해상도에 누가 강한지, 안티알리아싱에 누가 약한지... 등등을 추세선의 기울기를 통해 명확히 확인할 수 있습니다. 여기서 R9 290X는 GTX 780과 시종일관 거의 같은 성능을 보이며 추세선이 겹쳐져 있습니다.



▲ 각 해상도에서 안티알리아싱이 적용되었을 때의 성능하락률을 나타낸 표입니다.

이 테스트에서만큼은 그래픽카드 종류에 상관없이 다들 비슷비슷한 하락폭을 보여주고 있습니다.



▲ 한편, 테스트 내내 R9 290X는 간헐적인 클럭 하락을 겪었는데, Wattman을 사용해 측정한 소비전력이나 MSI 애프터버너를 통해 확인한 GPU 온도 등에 특이점이 없던 것으로 보아 소비전력 부족 혹은 쓰로틀링이 원인인 것은 아니라고 여겨집니다. 아무래도 정식 드라이버가 없는 상태인 것을 감안하면 출시 후 한두달 이내에 좀 더 나아질 것으로 생각하고 넘어가도록 하겠습니다.


클럭이 군데군데 떨어져 있기는 하나 전체 테스트 시간에 비하면 매우 짧은 시간 동안의 하락이라 평균 클럭은 스펙상의 최대 부스트클럭인 1000MHz에 근접해져 있습니다.


(※ 주 : 리뷰를 다 작성한 뒤 알게 된 사실로, R9 290X는 듀얼바이오스 스위칭을 통해 Quiet 모드와 Uber 모드 두가지를 선택할 수 있다고 합니다. 이 중 Quiet 모드는 Uber 모드보다 쿨링팬 회전속도의 상한이 낮게 설정되어 있으며 GPU 온도가 섭씨 95도에 도달하는 순간 작동속도가 하락하도록 설계되었다고 하는데, 추후 두 모드간의 비교와 함께 제가 이 리뷰를 진행한 모드가 어떤 모드에 해당하는지를 파악해 알려드리도록 하겠습니다. 꼼꼼한 체크가 선행되지 못한 점 매우 죄송합니다)



▲ 이 테스트에서의 소비전력은 R9 290X가 GTX TITAN보다 더 높게 측정되었습니다.


이번에 보실 결과는 드디어(!) 3D 게임 성능 테스트입니다. 바로 2010년 즈음 몇 안되는 'DX11 게임 벤치마크 툴'을 제공했단 인연-_-으로 지금까지 제 벤치마크 엔트리에 이름을 올리고 있는, 에일리언 대 프레데터 3입니다. (비록 요즘은 아무도 이 게임을 안 하시는것 같지만...☞☜)



▲ 우선 가장 대중적인, 하지만 요즘은 살짝 저사양으로 치부되려 하고 있는 1080p에서의 성능을 살펴보면, 안티알리아싱 적용 여부에 따라 GTX TITAN과 R9 290X의 순위가 바뀌는 것을 알 수 있습니다. (그래프는 안티 적용시를 기준으로 정렬되어 있습니다) 비슷한 관계가 양사의 중상위급 라인업인 GTX 770과 R9 280X, 그리고 명목상 최고 성능 라인업인 GTX 690과 7990 사이에서도 나타나고 있습니다.



▲ 2560 x 1600 해상도에서도 마찬가지의 결과입니다.



▲ 5760 x 1080 서라운드 디스플레이 환경에서의 결과입니다. 여기서부터는 안티 적용 여부에 상관없이 R9 290X가 GTX TITAN을 앞서고 있습니다. R9 290X의 위치는 GTX TITAN과 GTX 690의 사이인데, 안티 미적용시에는 GTX TITAN에 더 가까운 성능이지만 안티가 적용되면 듀얼 GPU 카드인 GTX 690에 근접한 성능입니다.



▲ 4K UHD 해상도에서의 결과도 아까와 다르지 않습니다.



▲ R9 290X의 추세선과 비교해 보면 상대적으로 다른 대조군들이 급격한 등락을 보임을 알 수 있습니다. 안티알리아싱의 적용이나 고해상도로의 이행이 R9 290X보다 다른 카드에 성능에 더 큰 타격을 준다는 뜻입니다.



▲ 안티알리아싱 적용이 성능에 미치는 영향입니다. 다른 카드들이 30~40%까지의 성능 하락을 겪는데 비해 R9 290X는 시종일관 26~28%의 비교적 양호한 성능 하락률을 보여줍니다.



▲ 한편, 이 테스트에서는 먼젓번 테스트보다 클럭 하락이 더 심했는데 일단 테스트 구간 내에서의 평균 클럭은 972MHz로 측정되었습니다. 그런데 그래프의 추세로 보건대 더 장시간 테스트를 돌리면 평균클럭이 더 낮아질것처럼 보이기도 합니다. 일단 마지막 순간의 평형점은 920~930MHz 사이에 위치합니다.



▲ 이 테스트에서 R9 290X의 소비전력은 비교적 높은 편입니다. GTX TITAN보다 높은 건 성능이 더 좋았으니 그렇다 치더라도 GTX 690보다 높은 건... 자사의 전세대 플래그십인 R9 280X보다는 약 40W, 시스템 전체 소비전력을 기준으로 대략 11%정도를 더 소비합니다.


이번에 보실 게임은 2년 전 가장 핫한 게임이었던-_- 배틀필드 3입니다. 원래는 배틀필드 4 오픈 베타를 엔트리에 넣고 있었는데, 그새 "오픈"베타가 잠겼단 사실을 뒤늦게 알았습니다. (아쉬운 대로 예전에 작성한 배틀필드 4 오픈 베타 벤치라도... : http://udteam.tistory.com/547)



▲ 1080p에서 R9 290X는 GTX TITAN과 GTX 780 사이의 성능을 보이고 있습니다.



▲ 2560 x 1600 해상도에서도 같은 결과입니다. 참고로 기존의 Hawaii-XT Engineering Sample 리뷰에서는 두 해상도 모두에서 Hawaii-XT ES가 GTX TITAN을 앞섰던 바 있기에 지금의 결과가 약간 당혹스러웠습니다. (Hawaii XT ES 리뷰 : http://udteam.tistory.com/539)



▲ 반면 해상도가 오르자 R9 290X가 GTX TITAN을 앞서기 시작합니다.



▲ 4K UHD에서도 바뀐 순위가 그대로 유지됩니다.



▲ 위의 결과를 해석하기 앞서 5760 x 1080 해상도(3 x 1 서라운드 디스플레이)와 4K UHD의 관계를 짚고 넘어가자면, 전자는 16:9 비율 모니터의 3 x 1 확장으로 48:9 라는, 가로로 긴 화면비율을 가지며 총 픽셀 수는 대략 6백만개가 됩니다. 반면 후자는 일반적인 16:9 비율을 유지하며 픽셀 수는 대략 8백만개를 약간 넘는 수준으로, 픽셀 수는 후자가 더 많지만 시야각에 따른 (그래픽카드가 렌더링해야 할) 오브젝트의 수는 전자가 더 많은 아리송한 관계가 됩니다. 경우에 따라 (픽셀 구현에 더 많은 자원이 투입되어야 할 경우) 4K UHD쪽의 성능이 더 떨어질수도, 반대로 오브젝트 렌더링에 더 많은 자원이 소요될 경우 5760 x 1080 쪽의 성능이 더 떨어질 수도 있는 가변적인 관계로, 편의상 모든 테스트에서의 평균적인 성능과 픽셀 수 등을 고려하여 4K UHD를 이 리뷰에서는 더 상위 옵션으로 간주하고 있음을 알려드립니다.



▲ 이 게임에서는 안티알리아싱 적용에 따른 성능하락이 비교적 공평하게 나타나고 있습니다.



▲ 이 테스트를 수행하는 동안의 R9 290X의 클럭은 위와 같이 변화했습니다. 앞의 장과 마찬가지로, 테스트 지속시간이 더 길어질 경우 평균 클럭이 더 떨어질 것으로 생각되기도 합니다. 이에 대해선 추후 더 탐구해 보도록 하겠습니다.



▲ 이 게임에서 R9 290X의 소비전력은 GTX TITAN보다는 많고 GTX 690보다는 적었습니다.


이번에 테스트할 게임은 바이오쇼크 : 인피니트입니다. 바이오쇼크는 처음 출시 당시 수려한 '물' 표현으로 인기를 끈 바 있는데 (물론 게임의 줄거리나 세계관이 인기엔 더 많은 영향을 주었겠지만 -_-;;;;;;) 몇년의 시간이 지나는 동안 '그래픽'으로 이 게임을 논하기는...... 조금 민망해진 것이 사실입니다. 그래도 비교적 최신 게임이니 테스트 엔트리에 넣었는데, 결과는 과연 어떠할지. 살펴보도록 하겠습니다.



▲ 그동안과는 반대로 상위 옵션(이 게임의 벤치마크 툴은 안티알리아싱 옵션을 조정할 수 없어, 대신 DDOF라는 옵션의 적용 여부를 달리해 가며 테스트를 진행했습니다)이 적용되기 전보다 적용된 후의 R9 290X의 상대성능이 더 낮아 보입니다. 1080p에서는 GTX TITAN과 R9 290X의 차이는 견고해 보이며, DDOF의 적용 여부에 따라 GTX 780과 R9 290X가 엎치락뒤치락 하고 있습니다.



▲ 2560 x 1600 에서도 마찬가지입니다. DDOF 미적용시 R9 290X의 성능은 GTX TITAN을 상회합니다.



▲ 5760 x 1080 해상도에서도 결과는 변함이 없고,



▲ 4K UHD 해상도에서도 순위에는 변동이 없습니다.



▲ 성능 추세선을 보면 DDOF의 적용 여부에 따라 R9 290X가 어지럽게 오르락내리락 하는 것을 볼 수 있습니다.



▲ DDOF 옵션이 해상도별로 성능에 미치는 영향입니다. 여기서만큼은 지포스들이 라데온들보다 더 나은 옵션 수용력을 보여줍니다.



▲ 이 테스트 동안 R9 290X의 작동 클럭은 비교적 안정적으로 유지되는 편이었습니다.



▲ 이 테스트에서 R9 290X의 소비전력은 GTX TITAN과 GTX 780의 중간 수준입니다.


이번에 테스트할 게임은 마치 FPS 같은 RTS 게임......하지만 정작 한번도 플레이해 본적은 없는 컴패니 오브 히어로즈 2입니다. (게임은 있는데 정작 실행은 벤치마크 툴밖에 안 해봤다는게 함정 -_-;) 일단 일반론적인 언급으로, 통상적으로 RTS 게임은 FPS 게임에 비해 보다 CPU 의존적이며 상대적으로 그래픽카드 성능에는 덜 의존하는 경향이 있음을 짚고 넘어가도록 하겠습니다.



▲ ......라고 말한 것이 무색하게 R9 290X의 성능이 최고로 나왔습니다.

크파/SLI 지원은 잘 되지 않는것 같습니다.



▲ 2560 x 1600 해상도에서도,



▲ 5760 x 1080 해상도에서도,



▲ 4K UHD 해상도에서도 똑같은 결과입니다.



▲ 성능 추세 그래프를 보면 R9 290X는 단순히 1위를 지키는것 뿐만 아니라 해상도 상향에 따른 성능하락률 자체도 다른 대조군들보다 월등히 적은 모습을 보여주고 있습니다.



▲ 이 게임에서 안티알리아싱이라는 옵션이 그래픽카드의 성능 발휘에 미치는 영향은 매우 균등합니다. 이 역시 그래픽카드 성능에 덜 의존적인 게임의 특성으로 볼 수 있을 것 같습니다.



▲ 이 테스트를 진행하는 동안 R9 290X의 GPU 클럭은 비교적 균등하게 1000MHz 언저리를 유지했습니다.



▲ 이 게임에서의 그래픽카드들의 소비전력은 잘 이해되지 않는데, 일단 7990은 -결과를 보니 크파가 지원 안되는것 같음에도 불구하고- 매우 높은 소비전력을 보이고 있는 점이 의아합니다. 그리고  R9 290X는 가장 좋은 성능을 보였음에도 GTX TITAN보다 낮은 소비전력을 기록하고 있습니다.


이번에 테스트할 게임은 그래픽 종결자 크라이시스의 후속작인 크라이시스 2입니다.



▲ 1080p에서의 결과입니다. 다른 대조군들이 100프레임 언저리에서 뭔가 유리 천장에 가로막힌듯한 모습을 보이는 것과는 대조적으로 R9 290X가 홀로 가장 좋은 성능을 보여주고 있습니다.



▲ 2560 x 1600 해상도의 결과입니다. 해상도가 높아지자 듀얼 GPU 그래픽카드들이 다시 힘을 내고 있습니다.



▲ 5760 x 1080 해상도에서도,



▲ 4K UHD 해상도에서도 같은 결과입니다.



▲ 성능 추세선에도 특별한 점은 없어 보입니다.



▲ 이 게임은 안티알리아싱이라는 옵션이 성능에 미치는 영향이 다른 게임들보다 상당히 적은 편입니다.



▲ 이 게임에서 R9 290X의 작동 클럭은 시종일관 1000MHz 언저리에서 안정적으로 유지됩니다.



▲ 이 게임에서 R9 290X의 성능이 좋았던 만큼 소비전력도 다른 대조군에 비해 높습니다.


이번에 보실 게임은 크라이시스계의 따끈따끈한 신상, 크라이시스 3입니다.



▲ 1080p에서 R9 290X은 비록 박빙이긴 하지만 GTX TITAN을 앞서는 모습을 보여줍니다. GTX 770이 라이벌 격인 R9 280X를 큰 폭으로 앞서고 있는 것과는 사뭇 대조적인 결과입니다. 한편, 위쪽을 올려다보면 안티 적용 여부를 기점으로 하여 GTX 690과 7990이 치열한 선두 자리다툼을 벌이고 있는 것도 눈에 띕니다.



▲ 2560 x 1600 해상도에서도 같은 결과입니다.



▲ 그래픽 메모리 용량이 GPU당 2GB로 적은 편이어서일까요. 아니면 메모리 비트수가 256bit에 불과한 때문일까요. 선두권을 다투던 GTX 690이 5760 x 1080 해상도에서는 거의 꼴지에 가까운 순위하락을 겪은 가운데 R9 290X는 오히려 더 견고해지는 모습을 보이고 있습니다.



▲ 4K UHD 에서의 결과입니다. GTX 690 / GTX 770은 이 해상도에서 안티알리아싱까지 적용되자 플레이가 불가능한 수준으로 프레임이 떨어졌습니다. 이쯤에서 아무도 안 알아줄 것 같지만 생색을 좀 내자면... 저기 찍힌 4.4, 4프레임이란 숫자, 저것들마저 근성을 갖고 테스트 구간을 다 돌고서 얻어낸 수치라는 점!



▲ 이 게임에서의 성능 추세선을 보면 5760 x 1080 해상도부터의 GTX 690의 급락이 눈에 띕니다.



▲ 한편 크라이시스 2와 마찬가지로, 이 게임에서 안티알리아싱이 성능에 미치는 영향은 각 그래픽카드별로 비차별적으로 평준화(flatted indifferently)되어 있습니다.



▲ 평균 클럭은 995MHz로 안정적인 편이지만, 순간순간 클럭 드랍이 일어나는 점이 신경쓰이게 합니다. 카탈리스트 업데이트로 좋아질 부분인지, 혹시 하드웨어적인 결함은 아닌지 궁금해지는 부분입니다.



▲ 이 게임에서의 소비전력은 성능 순위를 착실하게 따르고 있습니다. R9 290X는 GTX TITAN보다 소폭 높은 소비전력을 보입니다.


이번에 보실 게임은 Ubisoft사의 파 크라이 3입니다. 한때 이 게임을 개발했던 개발자들이 훗날 크라이시스 시리즈를 개발했음은 널리 알려진 사실이고, 이 게임은 크라이시스 2/3과 같은 크라이엔진 3에 기반을 두고 있습니다. 한편 이 게임으로 말씀드릴것 같으면!!!!! 원래는 제 벤치마크 엔트리상에 존재하지도 않았던 게임이나(∵ 갖고 있질 않았음) 불과 일주일 전 MSI의 페이스북 이벤트에서 당첨되어 득템한-_- 엄청난 인연이 있는 게임입니다. 당첨을 확인하자마자 벤치툴로 써야겠단 결심을 했다는...



▲ 1080p에서는 안티 적용여부에 따라 순위가 뒤바뀌는데, 특이하게 안티가 R9 290X에 더 악영향을 주는 몇 안되는 케이스 중 하나입니다. 대체로 GK110 형제들보다 R9 290X가 약세인데, 안티 미적용시에는 GTX TITAN과  GTX 780의 사이쯤 되는 성능이며 안티 적용시에는 GTX 780보다도 더 낮은 성능으로 떨어집니다.



▲ 2560 x 1600 해상도에서는 R9 290X가 GTX 780을 안정적으로 넘어서지만, 여전히 GTX TITAN보다는 낮은 성능입니다.



▲ 5760 x 1080 해상도에서도 별반 다르지 않은 결과입니다.



▲ 반면 4K UHD 해상도에서 안티를 적용하면 R9 290X는 무려 두 계단이나 뛰어올라 GTX 690까지 앞지르게 됩니다. 다만 이 설정 하에서는 어떤 카드로도 실제 플레이는 어려워 보입니다.



▲ 성능 추세선입니다. 그동안과 비슷한 양상을 보이고 있습니다. (언제나 그래프 해석은 여러분의 몫!)



▲ 이 게임도 안티알리아싱이 성능에 미치는 영향이 상당히 평준화되어 있습니다.



▲ 이 테스트를 진행하는 동안 R9 290X의 작동 속도는 간헐적으로 드랍이 관측되기는 하나, 전체적인 평균 클럭은 1000MHz 언저리를 잘 유지하는 편입니다.



▲ 이 게임도 R9 290X의 전성비를 나쁘게 만드는 게임 중 하나인듯 합니다. R9 290X는 GTX TITAN, GTX 690을 모두 뛰어넘는 소비전력을 기록하고 있습니다.


이번에 보실 게임은 힛맨 : 앱솔루션이란 게임입니다.



▲ 1080p에서 안티 미적용시 R9 290X의 성능은 다른 모든 대조군들을 제치고 1위였지만, 안티가 적용되자 듀얼 GPU 카드들에게 1, 2위를 내주고 3위로 내려앉았습니다. 그렇더라도 GTX TITAN보다는 뚜렷한 우세를 보이고 있습니다.



▲ 2560 x 1600 해상도에서의 결과입니다. R9 290X는 GTX TITAN과 GTX 690 사이의 성능을 보여주며, GTX 690쪽에 더 가까운 성능입니다.



▲ 5760 x 1080 해상도에서 R9 290X의 안티 적용시의 성능은 GTX 690마저 넘어섰습니다.



▲ 4K UHD에서 이러한 경향은 더욱 뚜렷하게 굳어집니다.



▲ 이 게임에서 성능 추세 그래프는 위와 같습니다.



▲ 이 게임에서는 확연히 라데온들이 지포스들보다 안티알리아싱의 타격을 덜 입고 있습니다.



▲ 이 게임에서 테스트를 진행하는 동안 R9 290X의 클럭은 안정적으로 스펙상의 상한선을 마크하고 있습니다.



▲ 이 게임에서 R9 290X는 성능이 좋았던 만큼 소비전력도 상당한 수준입니다.


이번에 보실 게임은 크라이시스에 버금가는, 어떤 측면에서는 크라이시스보다도 더 사양을 많이 잡아먹는 메트로 2033의 후속작, 메트로 : 라스트 라이트입니다. 여담이지만 제가 제일 좋아하는 게임이 메트로 2033이었고, 이 게임에서만큼은 항상 당대의 라이벌 관계를 형성하던 라데온보다 지포스가 프레임이 더 잘 나왔기에, 이것이 제가 오랫동안 지포스를 선호해 온 이유가 되기도 했습니다. 과연 R9 290X은 어떤 모습을 보여줄지 궁금합니다.



▲ 1080p에서는 R9 290X가 GTX TITAN과 GTX 780의 사이에 위치합니다.



▲ 2560 x 1600 해상도에서도,



▲ 5760 x 1080 해상도에서도 같은 패턴이 반복됩니다.



▲ 4K UHD에서는 R9 290X가 비로소 GTX TITAN을 앞서게 되었지만, 이미 이 프레임으로 플레이를 하기는 좀...



▲ 이 게임에서의 성능 추세선은 보시는 바와 같습니다.



▲ 이 게임에서도 안티알리아싱이 성능에 미치는 영향의 그래픽카드 종류에 따른 차이는 크지 않은 편입니다.



▲ 이 게임에서는 상당히 반복적이고 꾸준한 클럭 드랍이 일어났는데, 그 결과 R9 290X의 평균 작동속도는 984MHz까지 떨어졌습니다.



▲ 클럭 드랍이 많았던 탓일까요. 성능이 상대적으로 덜 나온 탓일까요. 이 게임에서 R9 290X의 소비전력은 GTX TITAN보다는 적고 GTX 780보다는 많게, 정확히 성능상의 순위를 반영하여 측정되었습니다.


이번에 보실 게임은 엘더스크롤 V 스카이림입니다. 이 게임 역시 크라이엔진에 뿌리를 두고 있다고 합니다.



▲ 우선 1080p에서의 성능을 보면, 이 해상도에서 프레임을 결정짓는 요소는 그래픽카드 외적인 요소인 듯 합니다. 거의 모든 대조군이 120~130프레임 언저리에서 발목이 잡힌 듯한 모습입니다.



▲ 2560 x 1600 해상도에서도 마찬가지입니다.



▲ 5760 x 1080 해상도에서 서열이 드러나기 시작했는데, 이 게임에서 R9 290X의 성능은 그리 좋지 않아 보입니다.



▲ 4K UHD 해상도에서 R9 290X는 GTX 780을 넘어서기는 했지만 여전히 GTX TITAN보다는 낮은 성능입니다.



▲ 이 게임에서의 성능 추세 그래프입니다.



▲ 이 게임에서 안티알리아싱이 성능에 미치는 영향은 별로 크지 않은 편이지만, 라데온 계열보다는 상대적으로 지포스 계열에 더 큰 타격을 입히고 있습니다.



▲ 한편 이 게임에서도 간헐적인 클럭 드랍이 꾸준하게 나타나는데, 평균 클럭은 1000MHz에서 크게 벗어나지는 않는 모습입니다.



▲ 이 게임에서 R9 290X의 성능은 그리 좋지 않은 편이었지만, 소비전력은 7990을 제외하고 대조군 중 가장 높은 수치를 기록했습니다.


이번에 보실 게임은 툼 레이더 : 리붓입니다.



▲ 1080p에서는 안티 적용 여부에 따라 R9 290X와 GTX TITAN의 순위가 갈리고 있습니다.



▲ 2560 x 1600 에서는 안티 적용 여부에 상관없이 R9 290X가 GTX TITAN보다 좋은 성능을 보입니다.



▲ 5760 x 1080 해상도에서 안티가 적용되면 GTX 690 / GTX 770의 성능이 급락합니다. 메모리 비트수가 대조군 중 최하위권인 탓이거나 GPU당 메모리용량이 상대적으로 더 적기 때문일 것 같습니다. 어부지리로 R9 290X는 7990에 이어 2등을 차지했습니다.



▲ 4K UHD 해상도에서도 마찬가지의 결과입니다.



▲ 이 게임에서의 성능 추세 그래프입니다.



▲ 이 게임에서 안티알리아싱이 성능에 미치는 영향은 대체로 평준화되어 있지만, 수치를 단순 비교하자면 라데온들이 지포스들보다 상대적으로 덜 타격을 입는 편이기는 합니다.



▲ 이 게임에서 R9 290X는 비로소 클럭 드랍 없이 깔끔하게 1000MHz를 유지하고 있습니다.



▲ 이 게임에서 R9 290X는 꽤 좋은 성능을 보인 반면 소비전력은 GTX 780과 비슷한 수준으로 상당히 낮습니다.


지금까지 살펴본 3D 게임 및 Valley 벤치마크의 성능을 요약하면 아래 표와 같습니다.


우선 안티 미적용시의 해상도별 성능입니다. R9 290X를 기준으로 표준화(normalize)되어 있습니다.

(표가 축소되어 있으니 클릭해서 보세요!)



안티 적용시의 성능 표는 아래와 같습니다.



일단 여기까지의 결과를 종합하면, 1080p에서는 GTX TITAN이 1% 앞서다가 안티/해상도 둘 중 하나만 더 높아져도 완전히 동률을 이루고, 그 뒤론 꾸준히 R9 290X의 우세입니다. 게임 타이틀 갯수를 기준으로 하면 1080p에서는 R9 290X와 GTX TITAN이 각각 우세한 게임이 6:6으로 완전히 동점인데, 최고 해상도에서는 9:3으로 R9 290X쪽이 압도적으로 우세한 모습을 보여줍니다.


아래는 위에서 구한 각 그래픽카드별 평균 성능 및 그동안의 게임 테스트에서 구한 소비전력으로 계산한 소비전력 대비 성능입니다. 참고로 그래픽카드 없이 부팅 후 평형점에 도달한 시스템의 소비전력이 대략 100W로, 지금까지 측정한 소비전력에서 100W씩을 빼고 평균값을 취해 평균 소비전력을 얻었으며, 아래의 전력대 성능비는 R9 290X를 기준으로 표준화한 값입니다.



▲ R9 290X의 게임 전성비는 GTX TITAN / GTX 780보다는 근소하게 낮은 편입니다. 자사의 전세대 플래그십인 R9 280X나 듀얼 GPU 카드인 7990보다는 더 좋은 전성비를 보여주고 있습니다. 한편 여기서는 GTX 690이 가장 좋은 전성비를 보여줍니다.


지금부터 보여드릴 것은 개인적으로는 처음 시도하는 분석인데, 아마 이 리뷰 전까지는 국내의 어떤 벤치마크 사이트에서도 시도하지 않았던 내용일 것이라 생각합니다. 바로 이 파트를 위해 이 글 초입의 테스트 설정 파트에서 기나긴 멍석을 깔았던 것인데... 바로 "프레임 지연시간(frametime)" 다면평가입니다. 다른 모든 테스트를 합친 것만큼의 시간이 소요되었고 분량 또한 상당히 깁니다. 부디 차근차근 따라오시면서, 놀라운 결과를 만나 보셨으면 좋겠습니다. 마음의 준비 단단히 하시고! 출발해 보겠습니다.


앞서 테스트 설정 파트에서 프레임 지연시간을 바탕으로 세 가지 서로 다른 값을 도출해 낼 수 있음을 설명했는데, 이들은 각각 평균값(Mean) / 95 퍼센타일값(95 Percentile) / 분산값(Variance)이라는 이름을 가집니다. 여기서 평균값은 해당 테스트에서의 평균 프레임의 역수와 비슷한 의미를 가지며, 95 퍼센타일값은 해당 테스트에서의 최소 프레임의 역수(정확히는 하위 95%구간에 해당하는 프레임의 역수입니다)에 해당합니다. 우선 이 두 값을 그래프로 나타내 보았습니다.



▲ 앞서 설명했듯 평균값은 평균 프레임의 역수에 해당하며 95 퍼센타일값은 최소 프레임의 역수에 해당합니다. 따라서 그래프의 막대가 짧을수록 더 좋은 결과임을 의미하며, 대체로 앞선 게임 테스트 결과에서 살펴본 성능 서열과 유사한 순위를 나타내고 있습니다.


위 그래프에서 GTX 770과 R9 290X를 비교해 보면 GTX 770의 평균값은 R9 290X보다 더 크게(=나쁘게) 나타나지만 95 퍼센타일 값은 반대로 R9 290X보다 더 작게(=좋게) 나타나고 있는데, 이는 평균 프레임은 R9 290X가 GTX 770보다 더 잘 나오지만 최소 프레임은 GTX 770이 더 잘 나온다는 뜻입니다. 즉 GTX 770의 프레임 유지율이 더 좋다는 뜻으로 해석할 수 있고, 사실 이러한 결과는 라데온의 안티팬들이 고질적으로 지적하던 부분이기도 합니다. 다른 게임에서는 어떤 결과일지 쭉 지켜봅시다.



▲ 이 게임에서 GTX TITAN은 R9 290X보다 더 작은 평균값을 가지므로 GTX TITAN이 R9 290X보다 더 높은 평균 프레임을 기록한다고 볼 수 있습니다. 실제로 에일리언 대 프레데터 3의 테스트에서 1080p 해상도에서의 결과를 보면 안티알리아싱 미적용시 GTX TITAN이 근소하게 더 좋은 결과를 보입니다.


반면 95 퍼센타일값을 보면 이야기가 달라지는데, 보시다시피 R9 290X의 95 퍼센타일값이 GTX TITAN보다 더 작게 나옴으로써 R9 290X가 GTX TITAN보다 더 나은 프레임 유지율을 보임을 증명합니다. 앞서 이 게임에서의 프레임이 초당 100프레임 이상으로 측정되어 60Hz의 리프레시율을 갖는 모니터에서는 육안에 의한 변별이 불가능함을 생각할 때, 이러한 최소프레임의 높은 유지가 사용자의 체감에는 더 큰 영향을 미친다고 볼 수 있기에 95 퍼센타일값의 분석은 중요한 의미를 가집니다.



▲ 이 게임에서는 R9 290X과 GTX TITAN 사이에서는 특별한 역전현상 없이, 평균값과 95 퍼센타일값의 서열이 비슷하게 유지되고 있습니다. 다만 시야를 위/아래로 옮겨 보면 GTX 690과 7990, GTX 770과 R9 280X가 미세하게나마 두 값의 역전을 겪고 있음을 알 수 있는데, 앞에서의 설명을 원용하자면 GTX 690보다 7990이, R9 280X보다 GTX 770이 각각 더 좋은 프레임 유지율을 보인다고 볼 수 있겠습니다.



▲ 이 게임에서는 평균값과 95 퍼센타일값의 순위가 큰 변동을 겪고 있습니다. 일단 평균값을 기준으로 보면 7990은 대조군 중 가장 짧은 시간을 보임으로써 가장 좋은 평균 프레임 수를 보장하지만, 95 퍼센타일값은 거의 R9 280X에 가까운 수준이 되어 대조군들 중 꼴지 수준이 되었습니다. 반면 R9 290X는 다른 라데온 형제들과는 달리 대조군 중 가장 낮은 95 퍼센타일값을 가짐으로써 1등을 차지했는데, 이는 라데온들보다 지포스들에 오히려 가까운 결과입니다.



▲ 이 게임은 지포스 계열이 전반적으로 나쁜 95 퍼센타일값을 보이는 가운데 R9 290X는 대조군 중 가장 낮은 95 퍼센타일값을 보여주고 있습니다.



▲ 이 게임에서도 R9 290X은 가장 낮은 95 퍼센타일값을 보입니다.



▲ 이 게임에서 R9 290X의 평균값은 GTX TITAN보다도 약간 더 나쁜 결과이지만 95 퍼센타일값은 훨씬 더 작은 수준으로 방어하는 것이 눈에 띕니다. 우리에게 익숙한 프레임 단위로 환산해서 말하자면, R9 290X는 GTX TITAN보다 낮은 평균 프레임을 보이지만 더 높은 최소 프레임을 갖는다는 뜻으로, 달리 말하자면 프레임 유지를 더 잘 한다는 뜻이 됩니다.



▲ 이 게임에서는 지포스 형제들이 나란히 1, 2, 3위를 차지했습니다. R9 290X는 라이벌들인 GTX TITAN / GTX 780보다는 떨어지는 95 퍼센타일값을 갖지만, 자사의 전세대 플래그십인 R9 280X와 비교하면 비약적으로 향상된 모습입니다.



▲ 이 게임에서도 R9 290X는 1등을 차지했습니다.



▲ 이 게임에서는 R9 290X의 95 퍼센타일값이 GTX TITAN과 GTX 780의 사이에 위치하고 있지만, 여전히 자사의 전세대 하이엔드인 R9 280X보다는 훨씬 좋은 모습을 보여줍니다.



▲ 이 게임에서는 지포스들이 모조리 상위권을 차지한 가운데, R9 290X는 라데온들 중에서는 가장 좋은 모습을 보여줍니다.



▲ 이 게임에서 R9 290X의 95 퍼센타일값은 GTX TITAN과 GTX 780의 사이에 위치하며, 역시 R9 280X나 7990보다는 훨씬 좋은 모습입니다.


그간 라데온들의 약점으로 지적되던 부분이 "평균 프레임은 괜찮은데 실제로 게임을 하면 끊기는 느낌이 든다" 였고 이는 프레임 지연시간의 분석으로 계량화가 가능합니다. 주목할만한 점은 290X가 기존의 라데온 (7990, 280X) 와 확연히 다른 모습을 보인다는 점인데 심지어 기존의 라데온들보다는 차라리 지포스에 더 가까운 정도의 최적화를 보여주고 있어 저를 놀라게 했습니다. 마치 라데온의 탈을 쓴 지포스 같다고 할까요.


실제로 게임을 돌리면서도, 예컨대 메트로 등의 게임에서 과거 5970이나 6990은 높은 프레임 측정값에도 불구하고 뚝뚝 끊기는 느낌이 분명 존재했고, 이는 제가 (그 게임들을 할 때만큼은) 지포스 계열을 선호하는 원인이 되기도 했는데, R9 290X를 테스트하면서는 그런 느낌이 들지 않아 상당히 놀라웠습니다. 매우 정성적(qualitative)인 의견이지만 이렇게밖에 표현할 방법이 없군요.


앞서 언급한 세 종류의 값 - 평균값 / 95 퍼센타일값 / 분산값 중 지금까지는 앞의 두 값을 살펴보았습니다. 이번에는 마지막 남은 분산값을 살펴볼 차례인데, 이 값이 갖는 수학적 의미를 한번 더 반복해 설명하자면 아래와 같습니다.


"이론적으로, 평균값이 10ms로 동일한 상황이더라도 시종일관 10ms를 꾸준히 유지하는 경우와 매 프레임마다 5ms -> 15ms -> 5ms -> 15ms를 오가는 경우가 있을 수 있는데, 단순히 평균을 취하면 10ms로 같아지지만 분산값은 후자가 압도적으로 크게 나옵니다. 분산값의 산술적인 의미는 '각각의 값이 평균으로부터 멀리 떨어져 있는' 정도를 나타내는 것으로, 분산값이 작을수록 해당 그래픽카드가 안정적으로 프레임을 그려내는 것이라고 볼 수 있습니다. 여담이지만 '크로스파이어를 했더니 뚝뚝 끊겨요' 라는 상황의 99.9%가 바로 이러한 불규칙적인 지연시간 때문에 발생하는 것이고, 따라서 분산값의 양상을 관찰하는 것도 매우 의미있는 분석이 됩니다."


충분한 설명이 되었기를 바라며...



▲ 이 벤치마크에서는 지포스들이 1~4위까지를 휩쓸고 있습니다. 하지만 R9 290X과 나머지 라데온들을 비교해 보면, R9 290X는 기존의 라데온보다는 비약적인 수준으로 분산값을 줄였다는 사실을 알 수 있습니다. 값의 유사함만으로 따지자면 라데온들보다는 차라리 지포스들 중의 한 계열처럼 느껴질 정도입니다.


한편, 7990이 단일 GPU인 R9 280X보다 더 높은 분산값을 가지는 것은 흔히 크파 구성시의 '마이크로 스터터링'이라고 부르는 현상의 원인이 되는데, AMD는 몇달 전 카탈리스트 13.8을 발표하며 '프레임 페이싱'이라는 기술을 도입해 이를 어느 정도 해결한 바 있으나, 보시는 바와 같이 아직 완벽하게 해결하지는 못한 것으로 보입니다.



▲ 역시 놀라운 결과입니다. R9 290X만 제외하고 보면 2~5위를 지포스들이 독식하고 그 아래 R9 280X와 7990이 놓여 있는 모습인데, 다시 한번 R9 290X의 이러한 특성은 그동안의 라데온들보다는 차라리 지포스에 더 가까운 모습이란 말을 해야겠군요.



▲ 이 게임에서는 R9 290X이 비록 GTX TITAN보다 떨어지는 분산값을 보이지만, 여전히 다른 라데온들과는 현격히 다른 모습을 보입니다.



▲ 이 게임도 마찬가지의 결과입니다. 여기서는 듀얼 GPU 카드들의 분산값이 그동안보다 현격히 높아져 있습니다. 다시 한번, SLI나 크파 구성시의 마이크로 스터터링 증가를 뒷받침하는 대목이며, 특히 크로스파이어에 미치는 악영향이 더 큼을 알 수 있습니다.



▲ 그동안과 마찬가지로 R9 290X는 기존의 라데온들보다 훨씬 낮은 분산값을 보이고 있습니다.



▲ 여기서는 유일하게 R9 290X가 R9 280X와 비슷한 수준의 높은(=나쁜) 분산값을 보이고 있습니다.



▲ 이 게임에서는 다시 R9 290X가 분산값 킹에 등극합니다.



▲ 여기서는 순위 자체보다도 값들이 몰려 있는 양상을 중요하게 보셔야 할듯 한데, 보시다시피 R9 290X는 다른 라데온들과는 홀로 떨어져 지포스들과 함께 어울려 있는 모습입니다.



▲ 그동안과 마찬가지의 결과입니다.



▲ 여기서도, 비록 R9 290X는 GTX TITAN/780보다 높은 분산값을 보이고는 있지만 여전히 다른 라데온들보다는 현저히 낮은 분산값을 보입니다.



▲ 이 게임에서는 앞서 크라이시스 2와 함께 이례적으로 R9 290X의 분산값이 가장 높게 나타났습니다.



▲ 이 게임에서는 다시 R9 290X가 왕좌에 올랐습니다.


종합하자면, 믿기 힘든 결과이지만 R9 290X가 거의 모든 게임/벤치마크에서 가장 좋은 분산값을 보이고 있습니다. "이건 라데온이 아니야!" 싶을 만큼 기존의 자사 제품군들과는 확연히 다른 경향을 보이며, 차라리 지포스 계열과 더 유사한 특성을 보이는데, 대체로 자사의 전세대 제품군인 7990 / R9 280X보다 확연히 줄어든 분산값을 나타내고 있습니다.


개인적인 생각으로는 게임 성능에서의 (평균 프레임의) 향상보다도 이런 질적인 측면 -최소 프레임 유지율이 더 좋다든지, 프레임 지연시간 분산값이 확연히 줄었다든지- 에서의 향상에 더 높은 점수를 주고 싶습니다. 이 점이야말로 그동안의 라데온들이 항상 지적받아왔던 부분이고, 실제로 지포스들에 "라데온보다 더 좋은 체감성능" 이라는 정성적(qualitative)인 꼬리표를 허용하는 빌미가 되어 왔기 때문입니다. 최소한 이 점에서만큼은 이번 R9 290X의 출시를 기점으로 AMD/엔비디아 양사가 동등해진 셈입니다.


한편, AMD가 라데온 R9 290X를 발표하기에 앞서 하와이에서 진행한 GPU14 TechDay 행사에서 발표한 자료에 따르면 Hawaii-XT GPU의 단정밀도 (single-precision) 연산성능이 5TFLOPS를 넘을 것이란 내용이 있었습니다. 이는 현존하는 GPU 중에서는 단연 최고 수준의 연산성능인데, 이번에는 과연 이러한 Hawaii-XT GPU를 탑재한 R9 290X의 GPGPU 성능이 어떠할지 살펴보도록 하겠습니다.

 

우선, 시네벤치처럼 간단한 렌더링을 돌려볼 수 있는 ratGPU의 결과값입니다.



▲ 듀얼 GPU 카드들을 제외하고는 GTX TITAN과 엇비슷한 차이로 R9 290X가 2위를 차지하고 있습니다. 근소한 차이이긴 하나 GTX TITAN보다 떨어지는 결과를 보인 것은 앞서 말씀드린 사실과 배치되는 내용이라 의아하기는 한데... 일단 결과로써 받아들이고 넘어갑시다.



▲ 소비전력은 -성능이 예상보다 높지 않았던 만큼- 상당히 낮은 수준입니다. GPU 자체만 작동할 때에는 전세대 플래그십인 R9 280X와 별 차이 없는 전력소비를 보여주는 것 같습니다.



▲ 아까와는 달리 계산 성능은 압도적인 차이로 1위를 차지했습니다. 우연히도 위에 열거된 수치는 각 GPU의 단정밀도 연산성능 수치에 거의 비례하는 값들입니다. (Hawaii-XT : 5.6TFLOPS, GK110-400 : 4.5TFLOPS로 알려져 있습니다)



▲ 성능이 높아진 만큼 소비전력도 소폭 증가했는데, 특이하게 GTX TITAN의 소비전력이 아까보다 대폭 늘었습니다. 아무래도 GK110의 큰 다이에서 연산 유닛만을 작동시키려 해도 부대적으로 운용되는 요소들이 더 많을 것이란 생각이 듭니다.


지금까지의 결과를 아래의 세 문장으로 요약해 보겠습니다.


1. 저해상도에서는 GTX TITAN와 완전히 똑같은 성능


- 테스트한 12종의 게임 및 UNIGINE Valley 벤치마크에서는 정확히 6:6으로 갈리는 모습인데, 자신이 주로 플레이하는 게임이 어느 제조사에 친화적인지에 따라 선택하시면 괜찮을 것 같습니다.


2. 고해상도로 갈수록 GTX TITAN을 앞서는 성능


- 테스트를 하며 느낀 점이라면, 비록 결과적으로는 저해상도에서 GTX TITAN과 거의 차별점이 없게 나왔습니다만 체감상으론 오히려 GTX TITAN보다 윗급이라는 생각이 들었습니다. 흔한 논점 중 하나인 "GTX TITAN 정도의 그래픽카드를 쓰는 사람이 왜 1080p에서 게임을 하겠느냐" 라는 질문에 대한 답변을 미뤄 두고서라도, 1080p에서 (그리고 상당수의 1600p 테스트에서도) 두 그래픽카드가 뿜어내는 게임 성능은 이미 60프레임을 초과하는 경우가 많아 일반적인 모니터의 리프레시율로는 구별하는 것이 불가능한데 비해, 프레임이 60프레임 미만으로 떨어지기 시작하는 5760 x 1080 이상급 해상도에서는 확연히 GTX TITAN이 뚝뚝 끊기는 것과 대조적으로 R9 290X가 매끄러운 플레이를 보장하는 경우가 많았기 때문입니다.


- 게다가 그래픽카드 성능 방정식(링크)을 사용해 계산한 R9 290X의 이론적인 성능 향상폭은 (280X 대비) 현재까지 관측된 것보다 오히려 훨씬 더 큰 편인데, 290X가 전례없이 높은 메모리 대역폭과 ROP 갯수로 무장한 만큼 아직까지는 512bit 메모리 대역폭과 64개의 ROP의 잠재력이 발휘되지 않은 편에 가깝다고 해석할 수 있을 것입니다. 이 점에 대해서는 향후 고사양을 요구하는 게임들이 하나둘씩 출시되어 갈수록 GTX TITAN 대비 우위가 확고해질듯 합니다.


3. 비약적인 프레임 지연시간 개선


- 1, 2번에서 언급한 성능향상(사실 이것만 해도 매우 놀랍습니다만)보다도 훨씬 x 1000000000 놀라운 점은, 라데온 계열의 고질적인 문제였던 프레임 지연시간의 불규칙성을 거의 기적적으로 개선했다는 점입니다. 적절한 비유인지 모르겠으나 이건 라데온의 탈을 쓴 지포스야... 하는 생각이 들더군요.



조만간 올릴 2부에서는 아래와 같은 토픽을 다룰 예정입니다.


1. 라데온 R9 290X의 오버클럭 여력 및 오버클럭시 성능, 소비전력, 각 게임별 클럭 변화

2. 라데온 R9 290X의 크파 성능 및 효율, GTX 690 / 7990 및 GTX TITAN/780 SLI와의 성능 비교

3. 기타 여러분이 댓글로 건의해 주시는 토픽들.


그럼 간단한(?) 떡밥 하나를 투척하며 이만 물러가겠습니다.



지금까지 긴 글을 읽어 주셔서 대단히 감사합니다.

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)