본문 바로가기

Review/vga_review

작지만 맵다, 라데온 R9 나노 리뷰 : (3) 성능 및 소비전력

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)

 

 

 

 

안녕하십니까 IYD/ITCM/공군 IT정보게시판 독자 여러분. 기다리고 기다리던 라데온 R9 나노 리뷰 3편이 현 시간부로 공개되었습니다. 긴말할 것 없이 본론으로 들어가 볼까요?

 

- 리뷰 1편 : 최초 입수, 외형 단독공개 (http://iyd.kr/717)

- 리뷰 2편 : #MakeItNano 프로젝트 (http://iyd.kr/766)

 

라데온 R9 나노는 지난 6월 발표된 R9 Fury X, 7월 발표된 R9 Fury의 뒤를 잇는 Fiji 칩셋 통산 세번째 출시 모델입니다. 셋 중 가장 작은 크기일 뿐 아니라 현존하는 어떤 독립형 그래픽카드보다도 짧은 15cm 기판을 가졌으며, TDP 역시 먼저 출시된 둘보다 대폭 낮아져 소형 폼팩터 PC 시장을 정조준하고 나온 제품이라 할 수 있겠습니다. 일단 출시 시기가 셋 중 가장 늦었으며, 외형적으로도 워낙 작고 단촐하게 생겼다보니 흔히 "삼형제 중 막내" 로 생각하는 시각이 많은 것이 사실입니다. 저 역시 그러했구요. 그러나 지난달 말경 전격적으로 공개된 이 제품의 스펙은 정작 여러 사람을 놀라게 했습니다. 바로 위 형뻘로 여겨졌던 R9 Fury과 같은 클럭을 가지면서, 코어 갯수는 오히려 늘어 R9 Fury X와 동급인 것으로 밝혀졌기 때문이었죠.

 

 

물론 전례없는 소형 폼팩터에 보조전원 케이블 하나만 요구한다는 점, TDP가 그만큼 낮아졌다는 점 등으로 미뤄 보아 많은 이들은 "1000MHz" 라는 작동속도가 항구적인 것이 아니라 가변적인 것이라 짐작했고, 섣부른 추측이긴 하지만 동일한 수치를 최대 클럭으로 표기해 출시되었던 라데온 R9 290X와 유사한 작동특성을 보이리란 추측 역시 여러 포럼에서 설득력있게 거론되곤 했습니다. 바로 몇달 전까지 전세대 라데온 시리즈의 왕좌를 지키던 R9 290X는 집권기간 내내 최대 클럭과 실제 작동속도 사이의 괴리에 많은 비난을 받았고, 설상가상 출시 초기 (2013년말) 각종 하드웨어 리뷰사이트에 제공된 것과 실제로 판매되는 것 사이의 평균 작동속도에 무시할 수 없는 편차가 있단 사실이 드러나며 회사의 도덕성에까지 타격을 준 일이 있었습니다. 이후 수많은 비레퍼런스 쿨러 탑재 제품이 등장하며 이런 비난은 서서히 잦아들었지만, 어쨌든 R9 290X에 탑재된 Hawaii 칩셋은 "밑도 끝도 없이 떨어지는" 클럭 변동폭으로 인해 많은 눈총을 받았으며 특히 변인통제를 중시하는 리뷰어들에게는 기피대상 1호쯤으로 여겨지게 되었습니다. (괜히 그동안 모든 리뷰의 성능 기준선이 지포스였던 게 아닙니다.) (참고로 Hawaii 칩셋의 경우, 온도가 섭씨 93도를 초과하는 순간 클럭이 떨어지도록 설계되었다고 알려져 있으며 그 최저선은 (풀로드 조건 하 최저 작동속도) 대략 700~800MHz 부근으로 알려져 있습니다.)

 

그렇다면, 이러한 역사적 사실로부터 우리가 무엇을 검증해야 하는지 명확히 도출되겠죠. 본 리뷰에서는 R9 나노의 성능을 정밀하게 측정하는 데 그치지 않고, 각 테스트 시나리오별로 클럭 변동 역시 면밀히 관찰하여 스펙상의 클럭 (1000MHz) 과 얼마나 큰 (혹은 작은) 괴리를 보이고 있는지 낱낱이 까발려 보려 합니다. 특히 레퍼런스 설계상의 단점을 더 크고 아름다운 비레퍼런스 쿨러와의 시너지로 돌파할 수 있었던 290 / 290X와 달리, 나노는 이미 그토록 작고 압축적인 레퍼런스 설계 자체에 대부분의 존재의의를 올인하다시피 했으며, 따라서 서드파티 제조사가 재량을 발휘하고 싶더라도 그럴 여지가 거의 없습니다. (이미 "아주 작다" 는 치명적인 가이드라인이 제시된 이상, 저 정도의 부피에서 공냉식 쿨링방식이 더 진보하는 데에는 한계가 있습니다.)

 

한마디로 과거와 비슷한 난관 (쓰로틀링) 이 뻔히 예견되는 가운데 퇴로 (서드파티 쿨러와의 협업) 를 스스로 차단해 버린 셈인데, AMD가 이러한 진퇴양난의 선택지를 택한 자신감이 과연 근거있는 것인지 아닌지 지금부터 파헤쳐 보도록 하겠습니다.

 

이번 리뷰를 진행하며, 원래는 라데온 R9 280 / 285 / 280X / 290 / 290X / 380 / 390 / 390X / 나노 / Fury / Fury X, 지포스 GTX 960 / 970 / 980 / 980 Ti / TITAN X를 대조군으로 삼아 벤치마크를 진행했으나 최종적으로 그래프를 그릴 때 R9 280 / 285 / 280X / 380 및 GTX 960을 뺐습니다. 이유는 주인공인 나노와 이들이 겨냥하는 시장 자체가 다른데다 이들이 포함되어 봐야 밑바닥을 깔아주기만 할 것이 뻔해, 어떤 의미있는 시사점을 더해줄 수 없다는 판단이 들었고 그럴 바엔 보여지는 대조군을 줄여 글의 주제를 좀더 명확히 보여주기 위해서입니다. 덕분에 그래프는 보다 깔끔하게, 등장하는 대조군 모두 골고루 살펴볼 수 있게끔 되었지만 전체 대조군의 3분의 1가량을 탈락시키며 그간의 제 수고 (...) 가 물거품이 되었단 점이 무엇보다 아쉽고, 그리고 제게 없는 280X 레퍼런스를 부득이 빌려 가면서까지 테스트를 진행했었는데 선뜻 본인의 그래픽카드를 빌려주셨던 공군 IT정보게시판 최석호님께 (비록 석호님의 280X로 얻은 결과값은 이번 리뷰에 수록되지 않게 되었지만) 이 자리를 빌어 감사의 말을 드립니다.

 

<목차>

 

1장 : 테스트 준비

2장 : GPGPU 성능 및 소비전력

3장 : 3D마크 성능

4장 : 게임성능 (Alien Isolation, Battlefield 4, Bioshock Infinite, Crysis 3)

5장 : 게임성능 (Dirt Showdown, Hitman Absolution, Metro 2033, Metro Last Light)

6장 : 게임성능 (Middle Earth Shadow of Mordor, Sleeping Dogs, Sniper Elite 3, Thief)

7장 : 성능 분석

8장 : 결론

 

 

1장 : 테스트 준비


테스트에 사용된 시스템 사양은 아래와 같습니다.

 

 

테스트에 사용된 게임 및 각 게임별 그래픽 품질 설정은 아래와 같습니다.

 

 

그동안의 리뷰와 달리, 본 리뷰를 진행하며 장시간의 구동으로 인한 예열이 GPU 성능을 제약하는지 여부를 명확히 검증하기 위해 통상적으로 적용해 오던 '각 시나리오별 3회 반복 후 중간값 채택' 이라는 공식을 나노에 한해서 약간 수정했습니다.

 

"1회 진행 후 3회 진행 (기록 측정), 다시 3회 진행 (GPU 클럭 로그), 기록측정 및 클럭 로그에서 중간값 채택"

 

즉 나노 테스트에는 기존보다 2배 이상의 시간이 소요되었으며, 뒤에 언급하겠지만 총 7회에 이르는 테스트 결과를 지켜보는 동안 결과값의 표준편차 이상으로의 변동이 전혀 관찰되지 않아 나노에서 발생하는 쓰로틀링은 전적으로 TDP 리미트에 의한 것이라는 결론을 얻을 수 있었습니다. 다만 Fiji 칩셋 자체가 저전력/고효율을 모토로 설계되었다고는 보기 어려운데다, 이러한 칩의 완전체를 그대로 탑재한 만큼 TDP 리미트는 상당히 극심하게 일어나는 편이었습니다. 아래의 그래프는 AMD의 발표자료에도 등장한 바 있던, 폼팩터별 성능 변화 그래프 (사실상 온도에 의한 쓰로틀링 현황) 입니다.

 

 

또한, 본 리뷰에서 제시할 클럭 값 중에는 평균값과 90분위값이라는 두 가지 값이 있습니다. 아마 많은 분들께 생소하실 90분위값을 한 마디로 설명하자면 사실상 '최소값' 으로 생각하셔도 무방한데, 정확히는 테스트 내내 측정된 클럭값 중 이 값을 초과하는 갯수가 전체의 90%임을 의미하는 값으로 간혹 무의미하게 뚝뚝 떨어지는 측정값을 분석에서 배제하기 위해 도입한 것입니다.

 

 

2장 : GPGPU 성능 및 소비전력


게임성능을 살펴보기 전, '게임 외적인 부분' 을 간단히 짚고 넘어갑시다. 이 장에서는 나노의 부동소수점 연산성능 (GPGPU 성능) 및 소비전력을 간단히 체크하고자 합니다.

 

 

나노의 공식 스펙을 곧이곧대로 믿는다면 연산성능은 Fury X에 이어 역대 2위에 해당할 만큼 강력한 수준입니다. 특히 Fiji 삼형제 중 가운데를 차지한다는 점은 Fury X의 코어 갯수와 Fury의 클럭의 조합으로 출시된다고 알려졌을 때부터 어느 정도 예견된 바였는데요. 하지만 실제 성능을 살펴보면 그보다 다소 떨어진 수치를 기록하고 있습니다. 물론 코어 갯수가 전례없이 많은 수준이다 보니 여전히 Fury X의 뒤를 잇는 2위이긴 합니다.

 

GPU로 연산성능을 테스트하는 동안 나노의 작동속도는, 초반 3분의 1가량은 스펙상 클럭인 1000MHz를 유지했으나 그 이후로는 약 10%가량 떨어진 900MHz 언저리에서 보합세를 보이고 있었습니다. 종합적으로 평균 클럭은 930MHz가 되었으나 아주 장기간 연산작업을 돌린다면 작동속도 평균은 결국 후반부의 새로운 균형점으로 수렴해갈 것이기에, 후반 평균만 따로 구해 보면 902MHz 가량이 됩니다. 즉 대부분의 GPGPU 작업에서 나노는 스펙상 표기된 것의 90%에 해당하는 성능을 보일 것이라는 전망입니다.

 

 

소비전력은 굉장히 놀라운 편인데, 3D마크 11이 (뒤이어 보시면 아시겠지만) 나노가 성능을 잘 못 발휘하는 테스트 툴이라 소비전력이 다 나오지 않았을 가능성을 감안하더라도 상당히 적은 소비전력을 보입니다. 전세대 플래그십인 290X보다 거의 100W가량 낮아졌으며 Fury보다도 50와트 가량 더 적은 소비전력을 보이고 있고, 특히 전력대 성능비가 대단히 뛰어난 편인 '맥스웰' 기반의 GTX 970 / 980보다도 소비전력이 적게 측정되었습니다.

 

자, 성능 외적인 부분을 살펴보았으니 이제야말로 성능을 살펴볼 차례입니다. 그나저나 앞의 두 그래프가 애피타이저 역할을 잘 수행했는지 궁금하군요. 호기심이 더욱 증폭되셨나요?

 

 

3장 : 3D마크 성능


이 장에서는 제가 수행한 여러 테스트 중 3D마크에서의 결과를 살펴보도록 하겠습니다. 그간 그래픽카드 리뷰에서, 결과 그래프마다 별도로 코멘트하지는 않고 마지막 분석 그래프에서 할 말을 한꺼번에 하던 게 제 나름의 방식이었지만 이 리뷰에서만큼은 각 테스트 항목마다 곁들여야 할 설명들이 있기에 평소보다 작업량이 훨씬 많아지게 되었습니다. 부디 재미있게 읽어 주시면 좋겠습니다.

 

 

우선 3D마크 11의 결과를 살펴보면, 한 마디로 '실망' 으로 요약할 수 있습니다. 정확히는 퍼포먼스 프리셋에 한해 실망이지만 어쨌든 제가 수행한 최초의 테스트에서 오늘의 주인공 나노는 Fury X / Fury는 물론 (공식 슬라이드에서 그렇게 쥐어패던) 전세대 플래그십 290X보다도 떨어지는 성능을 보이고 있기 때문입니다. 물론 여기서는 Fury X / Fury 모두 일반적으로 알려진 서열보다 한두 단계씩 낮아진 점을 볼 때, 저해상도에서 Fiji 칩셋의 성능이 다 발휘되지 못하는 특성과도 연관이 있다고 하겠습니다. 그 예로 오른쪽의 익스트림 프리셋에서의 결과는 Fiji 삼총사가 대폭 높아진 순위를 보이고 있습니다.

 

클럭 변동 그래프를 보면, 퍼포먼스 프리셋에서의 나노의 평균 작동속도는 895MHz로 앞서 GPGPU에서 살펴본 후반 평균 902MHz에도 못 미치는 수치입니다. 아무래도 3D 어플리케이션이 단순한 연산작업보다 GPU 내부의 유닛을 더 많이 활용하고, 그에 따라 같은 클럭에서의 소비전력이 증가했기 때문일 것입니다. 흥미로운 사실은 익스트림 프리셋에서의 클럭이 조금 더 낮아졌다는 점입니다. 895MHz에서 886MHz로의 하락은 어떻게 보면 오차범위 이내의 변동일 수 있으나, 이후 살펴볼 해상도별 테스트 결과에서도 똑같은 패턴은 항상 반복되었습니다. 해상도가 높아짐에 따라 GPU에 걸리는 로드가 얼마나 증가하는지(정확히는 GPU 이외의 기여도가 얼마나 감소하는지)를 눈으로 보여주는 아주 드문 자료라 할 수 있겠습니다.

 

참고로 이 테스트에서 중간 세 차례의 클럭 드랍이 관찰된 까닭은 3D마크 11이 총 네 개의 그래픽 테스트로 수행되고, 각각의 사이사이에 쉬는 시간이 있기 때문입니다. (Graphics Test 1~4)

 

 

3D마크 파이어 스트라이크에서 나노의 서열은, 아니 Fiji 삼형제의 전반적인 서열은 먼젓번 테스트보다 조금 오른 것으로 보입니다. 일단 나노의 순위는 980 위 / Fury 아래에 딱 끼어 변화가 없습니다만 Fury X의 순위가 UHD 해상도에서 980 Ti 위로 올라갔다는 데 의미를 둘 수 있겠습니다.

 

여기에서도 나노의 클럭은 드라마틱하게 변화했는데, FHD / QHD / UHD에서의 평균 클럭이 각각 898MHz / 887MHz / 868MHz로 꾸준한 우하향 추세를 보였다는 사실이 흥미롭습니다. 90분위값마저 꾸준히 내려가는 추세를 보이고 있습니다. 한편 각 테스트별로 중간에 뚝 떨어진 클럭값이 관측된 이유는 파이어 스트라이크 자체가 두개의 그래픽 테스트로 구성되기 때문입니다. (Graphics Test 1, 2)

 

 

4장 : 게임성능 (Alien Isolation, Battlefield 4, Bioshock Infinite, Crysis 3)


이어서 실제 게임성능을 살펴봅시다. GPGPU에서 살펴본 것, 3D마크에서 살펴본 것이 제각기 다른 특성을 보였는데 과연 게임들은 어떠할지 궁금하네요.

 

 

에이리언 아이솔레이션에서 가장 먼저 눈에 띄는 것은 해상도별 클럭 변동폭이 더욱 커졌다는 것입니다. (심지어 각 시나리오 내에서의 변동성은 더욱 작아졌음에도 불구하고 말이죠.) 말하자면 해상도별로 GPU에 가해지는 부하가 아주 뚜렷한 편차가 있게 되었다는 의미일 것입니다. FHD 해상도에서 944MHz로 비교적 높은 평균클럭을 보이던 나노는 QHD에서는 905MHz로, UHD에서는 873MHz로까지 떨어지고 있습니다.

 

재미있는 점은 -Fury와 나노의 성능관계를 유심히 보면- 해상도가 높아질수록 차이가 점차 벌어진다는 점입니다. Fury의 경우 대형 공랭쿨러와 두개의 8핀 보조전원 커넥터를 탑재해 쓰로틀링의 여지 없이 안정적인 1000MHz라는 클럭으로 작동하고 있으니 결국 나노의 상대적인 클럭이 해상도가 높아질수록 낮아지는 셈이고, 그에 따른 형제간의 서열관계 역시 점차 확실해진다는 점이 흥미롭습니다.

 

 

배틀필드 4에서도 비슷한 결과를 관찰할 수 있습니다. FHD / QHD / UHD에서의 나노의 평균 작동속도는 각각 937MHz / 904MHz / 876MHz로 측정되었으며 이는 앞서 살펴본 에이리언 아이솔레이션의 결과와도 거의 비슷한 것입니다.

 

 

바이오쇼크 인피니트에서도 나노의 작동속도가 해상도에 반비례해 떨어진다는 점은 명확히 드러납니다. 여기서 가장 재미있는 점은, FHD에서 비교적 고속으로 작동하는 나노의 성능은 (비록 그 한 해상도에서나마) 형인 Fury보다 높게 측정되었다는 사실입니다. 태생적으로 저해상도에서 약한 Fiji 칩셋을 탑재한 대신 저해상도에서 가장 클럭이 높아 (정확히는 가장 쓰로틀링이 덜 걸려) 손위 형제들과 엎치락뒤치락 하는 나노의 성능특성. 이러한 특징은 약일까요 독일까요. 계속 살펴봅시다.

 

 

크라이시스 3의 결과도 지금까지 살펴본 다른 게임과 유사합니다. 해상도가 높아질수록 나노의 클럭은 명확하게 떨어지고 있고, 그에 따라 Fury와의 성능 차도 점차 확대되고 있습니다. 사실 FHD에서는 Fury / 980 / 나노 셋 모두 소수점 이하 첫째 자리 정도의 성능차를 보여 사실상 동급이라고 볼 수 있었습니다만, 고해상도록 올라갈수록 나노의 클럭이 떨어지고 / 980의 경우 맥스웰이 고해상도로 갈수록 Fiji보다 상대열세인 특성에 따라 나노보다 더 가파른 폭으로 성능이 하락해 최종적으로 Fury > 나노 > 980의 서열이 굳어집니다.

 

 

5장 : 게임성능 (Dirt Showdown, Hitman Absolution, Metro 2033, Metro Last Light)


이어서 계속 게임성능을 살펴봅시다. (게임 테스트 결과를 각 장(chapter)으로 나눈 것은 별다른 기준이 아니라, 각 게임을 알파벳순으로 정렬한 후 4개씩 끊은 것입니다.)

 

 

더트 류의 게임은 대체로 GPU 자원을 많이 요구하지 않으며, 차라리 CPU에 의한 영향을 더 많이 받는 부류에 속합니다. 그런 만큼 다른 게임에 비해서 비교적 나노의 클럭 유지율이 좋았고, FHD 해상도에서는 거의 대부분의 시간 동안 나노의 최대클럭인 1000MHz에 근접해 있는 모습도 보였습니다. 그래서인지 FHD에서 나노의 성능은 이번에도 Fury를 앞서고 있습니다.

 

해상도별 클럭 변동은 FHD / QHD / UHD 차례로 각각 평균 987MHz / 936MHz / 894MHz 였습니다.

 

 

히트맨에서도 결과는 비슷한 양상을 보이고 있는데, 이 게임에서 FHD의 그래픽카드별 순위는 사뭇 이해할 수 없게 나왔습니다. 아마 FHD에서 상위권 변별력이 거의 상실되고, GPU 외적인 요소의 성능이 크게 반영된 결과가 아닐까 생각되며 GPU 아키텍처별로 크게 대별할 수 있는 결과가 나온 것이 그러한 판단의 근거입니다. (아키텍처별로 GPU 외부와 소통하는 방식에 차이가 있을 수 있기 때문입니다.)

 

이 게임에서, FHD 해상도에서 나노의 평균 작동속도는 무려 996MHz로 나타났습니다. 사실상 1000MHz 고정이나 마찬가지인 것이죠.

 

 

메트로 2033에서는 이 글 전체를 통틀어 관측된 나노의 클럭 중 가장 낮은 최소값 (90분위값) 이 찍혔습니다. UHD에서 782MHz까지 떨어지는 클럭을 보여주고 있죠. 비단 UHD에서만 유별난 것이 아니라 심지어 FHD에서도 나노의 최소클럭은 900MHz조차 넘지 못하고 있는 점에서 왜 메트로를 빡센 게임이라 하는지 대번에 이해할 수 있겠습니다.

 

그 와중에도, 재미있는 점은 FHD에서 나노의 평균클럭이 926MHz로 여타 게임들에 비해 평균-최소클럭간 편차가 컸다는 점이고, 이 해상도에서 나노가 Fury를 근소한 차이로나마 앞서고 있다는 점입니다. 다시 한번 나노의 딜레마 -Fiji 칩의 사용과 저해상도에서 높은 클럭- 를 실감하게 합니다. 또한 이 게임이 워낙 다른 게임보다 GPU 의존성이 심하다 보니, UHD에서는 Fiji 삼형제가 나란히 1~3위를 차지하는 모습까지 볼 수 있었습니다.

 

 

메트로 라스트 라이트는 전작보다는 조금 캐주얼해진 느낌입니다. 나노의 해상도별 평균클럭 추이는 앞서 살펴본 것과 크게 다르지 않지만 최저클럭은 확연히 개선되었고, 고해상도로 올라갔다고 해서 Fiji 삼형제가 탑 3을 휩쓴다든지 하는 이변도 관측되지 않았습니다.

 

 

6장 : 게임성능 (Middle Earth Shadow of Mordor, Sleeping Dogs, Sniper Elite 3, Thief)


이제 마지막 4개의 게임입니다.

 

 

미들 어스 역시 지금까지와 비슷한 양상을 보입니다만, 여기에서는 특이하게 UHD 해상도에서 나노가 390X에 역전을 허용해버리고(!) 말았습니다.

 

 

슬리핑 독스는 메트로 2033, 씨프과 함께 나노의 최저클럭을 700MHz대로 끌어내린 단 셋뿐인 게임입니다. 평균클럭의 측면에서는 오히려 메트로 2033보다도 낮아진 감이 있는데, 그래서인지 나노의 성능은 굳건히 Fury의 아래에 위치하고 있습니다. 그러면서 한편으로는 GPU에 대한 높은 의존성(부하)이 Fiji 전반에 호재로 작용해, UHD에서 Fury X는 TITAN X보다 높은 성능을 보였으며 Fury는 980 Ti보다 높은 성능을 보였습니다.

 

이 게임에서 나노의 해상도별 평균클럭은 FHD / QHD / UHD에서 각각 855MHz / 836MHz / 813MHz로 역대 최저수준 (3D마크 포함) 을 기록했으며, 스펙상 클럭과 비교하면 거의 15~20% 가까이 하향된 것입니다.

 

 

스나이퍼 엘리트 3에서 보이는 양상은 지금까지 살펴본 여느 게임들과 크게 다르지 않습니다. 마찬가지로 해상도가 높아질수록 나노의 평균 작동속도는 내려가고 있으며, 나노의 순위는 Fury 아래 / 980 위입니다.

 

 

씨프에서도 나노의 작동속도와 해상도가 반비례하는 양상은 반복됩니다.

 

 

7장 : 성능 분석


지금까지 앞의 4~6장에서 살펴본 테스트 결과를 모두 종합해 보겠습니다.

 

※ 알아둘 것 : 누적 프레임레이트(AF)와 평균 상대성능(ARP)은 성능을 분석하는 두가지 서로 다른 방법론입니다. 전자는 각각의 그래픽카드가 모든 게임에 걸쳐 얻은 프레임레이트를 단순히 합산한 것인 반면, 후자는 각 게임별로 특정한 그래픽카드를 기준(100%)으로 하여 모든 그래픽카드의 상대성능을 구한 뒤 모든 게임에 걸쳐 얻은 상대성능값의 평균을 구한 것입니다. 둘은 의미하는 바가 전혀 다르며, 반드시 같은 것도 아니고 같을 필요도 없습니다. 심지어 방법론에 따라 순위가 다르게 나오기도 합니다.

 

A, B 두 그래픽카드를 X, Y라는 게임에서 구동하는 경우를 예로 들겠습니다. A가 X에서 400 프레임, B에서 40프레임을 얻었다면 AF값은 440입니다(400+40=440). B가 X에서 360 프레임, B에서 80 프레임을 얻었다면 역시 AF값은 동일하게 440이 됩니다(360+80=440).

 

하지만 ARP는 이야기가 다릅니다. 우선 A를 기준으로 잡을 경우 X, Y에서 A의 성능은 자기 자신이 기준이므로 100%, 100%가 되고 따라서 둘의 평균인 ARP값 역시 100%가 됩니다. 그러나 B는 X에서의 상대성능이 A의 90%인 반면(360/400=0.9) Y에서의 상대성능은 A의 200%가 되기 때문에(80/40=2) 최종적으로 145%라는 ARP값을 얻게 됩니다((90%+200%)/2=145%). 즉 B의 성능이 더 좋다는 결론이 얻어집니다.

 

이러한 차이가 나오는 이유는, 기본적으로 각 게임에서 얻어지는 프레임레이트가 동일한 규모가 아니기 때문입니다. 어떤 게임은 초당 수백 프레임이 나오지만 어떤 게임은 초당 수십 프레임도 힘겨운 경우가 많습니다. 이 둘을 단순히 합산할 경우 프레임레이트가 작은 규모의 게임이 과소평가되는 문제가 있고, 바로 이 때문에 AF 방법론 하에서 B의 성능이 낮게 나타난 것입니다. 캐주얼한 온라인게임과 크라이시스 같은 패키지게임을 동일선상에서 비교할 때의 문제점이라고 생각하면 이해하기 쉬울 것입니다.

 

제가 매번 리뷰에서 두 방법론을 모두 사용해 보여드리는 것은 바로 이러한 점 (프레임이 많이 나오는 특정 게임에서 유리한 것과 전체적으로 여러 게임에서 고루 유리한 것) 을 짚어내기 위해서입니다.

 

 

우선 FHD에서의 결과를 분석해 봅시다. 모든 게임별 프레임을 합산한 것이 왼쪽에, (여기에 FHD에 해당하는 프리셋의 3D마크까지 더해) 평균 상대성능을 구한 것이 오른쪽의 그래프인데 기본적으로 FHD 성능에 있어서 Fury / 980 / 나노, 390 / 290X / 970의 성능은 각각 소수점 이하 한 자리대의 차이로 사실상 동급으로 묶을 수 있는 수준입니다. FHD에서 나노의 성능을 요약하자면 아래와 같을 것입니다.

 

"Fury / 980과 동급, 290X / 970보다 15% 더 좋은 성능"

 

한편 이 해상도에서 모든 테스트를 통틀어 나노의 평균 작동속도는 926MHz, 90분위값은 865MHz로 측정되었습니다. 공식 스펙 대비 약 7.4%가량의 클럭 손실을 겪은 셈입니다.

 

 

QHD에서의 결과를 보면 FHD에서 동급이었던 Fury / 980 / 나노 셋의 성능이 명확히 구분되기 시작했단 점이 눈에 띕니다. 980을 기준으로 나노는 104%, Fury는 108%에 해당하는 성능을 보이며 거의 등차수열을 이루고 있습니다. 여기서의 결과를 한 문장을 요약해 보면 아래와 같을 것입니다.

 

"980보다 4% 좋고 970보다 25% 좋은 성능"

 

혹은, AMD의 전세대 플래그십인 290X 및 현세대 플래그십인 Fury X / Fury와 비교하면 아래처럼 묘사할 수도 있을 것입니다.

 

"290X보다 18% 좋고 Fury보다 4%, Fury X보다 9% 떨어지는 성능"

 

한편 이 해상도를 통틀어 나노의 평균 작동속도는 895MHz, 90분위값은 844MHz로 측정되었는데 이는 공식 스펙보다 10.5%가량 손실을 본 것입니다.

 

 

마지막으로 UHD에서의 결과입니다. 나노는 980과 더욱 격차를 벌리며 상대성능을 올렸지만 한편으론 Fury와도 격차가 조금 더 벌어졌습니다. 태생적으로 고해상도에 강한 Fiji 칩셋의 장점이, 고해상도에서의 쓰로틀링으로 조금씩 희석되는 느낌이랄까요. 결과적으로 나노는 보통의 Fiji와 맥스웰의 중간적인 성능특성을 보이게 되었습니다.

 

여기에서의 나노의 평균 작동속도는 863MHz, 90분위값은 820MHz로 공식 스펙 대비 13.7%가량의 클럭 손실이 있었습니다.

 

 

8장 : 결론


지금까지 살펴본 내용을 정리해 봅시다. 라데온 R9 나노의 공식 스펙은 1000MHz라는 작동속도를 상정하고 있으나 실제로 이것이 유지되지 못할 거란 건 (아마 AMD를 빼고) 나머지 모두가 짐작했을 것입니다. 문제는 과연 쓰로틀링의 폭이 얼마나 크고 / 쓰로틀링의 트리거가 과연 무엇이냐 (온도냐 전력이냐) 는 점인데 일단 후자에 있어서는 전력이 유일한 트리거란 점이 명확해 보입니다.

 

한편 쓰로틀링의 폭은 아주 흥미롭게도 GPU에 실질적으로 가해지는 '로드' 에 비례해 커지는 모습을 보였는데, 이에 따라 저해상도에서 구동할 때의 작동클럭과 고해상도에서의 작동클럭이 서로 음의 상관관계를 보이게 되는 재미있는 현상이 관찰되었습니다. 구체적으로 모든 테스트를 통틀어 FHD의 평균 클럭은 926MHz, QHD 평균은 895MHz, UHD 평균은 863MHz로 기록되었습니다. 수치상으로는 나노 자신의 공식 스펙보다 7.4~13.7% 낮아진 것이고 동일한 칩셋을 사용한 Fury X보다는 각각 12~18% 낮아진 것입니다.

 

다른 모든 조건이 동일하다면 소비전력은 대체로 클럭에 비례하나 현실에서는 더 높은 클럭 = 더 높은 전압으로 이어지고, 전압 증가분은 그 제곱만큼 다시 소비전력을 상승시키기에 결국 최상위권 그래픽카드의 '사소한' 클럭 변화는 결코 사소하지 않은 소비전력 변화로 이어진다고 볼 수 있습니다. 바로 이러한 접근으로 AMD는 나노의 칩 커팅 없이도 소비전력을 대폭 절감할 수 있었던 것으로 보이며, 거꾸로 말해 이런 타이트한 TDP 리미트가 나노로 하여금 거의 상시적으로 관측되는 쓰로틀링을 유발하게 했다고도 볼 수 있습니다.

 

어쨌든, 이러한 특성들을 종합했을 때 나노의 객관적인 위치 및 나노가 의미있게 쓰일 수 있는 분야를 몇가지 제시하는 것으로 리뷰의 끝을 맺으려 합니다.

 

있는 그대로 보아, 나노의 성능은 가격이라는 요소가 결합되는 즉시 굉장히 어정쩡한 위상으로 추락합니다. 거의 모든 면에서 980보다는 앞서는 성능을 제공한다는 점에서 포지션이 겹치는 Fury와 비교를 시도할 수도 있겠으나 중요한 건 나노가 Fury보다도 100달러 가량 더 비싸다는 점입니다. 또한 980은, 나노보다 성능이 낮기는 하지만 가격 역시 더 낮기 때문에 나노와 시장에서 직접 경쟁조차 하지 않을 가능성이 높습니다. (간단히 말해 980을 사려고 돈을 모으던 사람은, 그 돈으로 나노를 살 수 없을 것이기 때문입니다.)

 

결국 나노만의 유니크한 요소가 무엇인지를 살펴보아야 하는데, 개인적인 생각으로 그러한 분야는 단 두개가 있습니다. 바로 연산용 머신으로의 활용가능성과, 소형 폼팩터 시스템 구성용으로 국한했을 경우입니다.

 

연산성능의 측면에서, 나노는 Fury X를 제외한 현존하는 어떤 그래픽카드보다도 뛰어난 연산성능을 갖는 모델입니다. 쓰로틀링을 고려하더라도 원체 탑재하고 있는 코어갯수 자체가 많은 관계로, 이론적으로는 750MHz까지 쓰로틀링이 걸리더라도 경쟁사의 최상급 그래픽카드인 TITAN X보다 더 높은 플롭스값을 갖게 됩니다. (그리고 다행히도, 지금까지 살펴본 어떤 테스트에서도 작동속도가 750MHz까지는 떨어지지 않았기에 실상 대부분의 경우 TITAN X보다 높은 연산성능을 보일 것으로 예상됩니다.) 물론 같은 값에 더 높은 플롭스값을 갖는 Fury X가 있지 않느냐 반문할 수 있겠지만, 나노는 Fury X보다 소비전력이 100W가량 더 낮다는 점으로 이를 상쇄할 수 있습니다. 적어도 고밀도 플롭스 머신을 제작하는 데 있어서는 나노야말로 최적의 솔루션이 나노가 아닐까 생각합니다.

 

또한 ITX 이하의 폼팩터에서, 나노는 단순히 'ITX 규격의 그래픽카드 중 가장 성능이 좋다' 는 문장 이상의 의미를 갖습니다. 기존의 제품으로 따라잡을 수 없는 수준의 성능대를 단독으로 구축하고 있기 때문입니다. 예컨대 ITX 규격의 (나노 이전까지 AMD가 제공하는 것 중 최상위 모델이던) 라데온 R9 380과 지포스 GTX 960 중에서 선택해야 할 때, 둘 사이에도 우열관계가 성립하겠지만 기본적으로 상호 침범 가능한 영역대의 성능을 갖기 때문에 사용자에게는 '이것 아니면 저것' 식의 선택지가 늘 존재하는 셈입니다. 그러나 나노의 경우 경쟁사의 GTX 970과 비교하더라도 최소 15% / 최대 36%까지 높은 성능을 보여, 기본적으로 성능 자체가 상호 침범 가능한 영역대에 있지 않습니다. 적어도 ITX 폼팩터를 구성하고자 하는 사용자들에게 기존에 존재하지 않던 상위의 선택지를 추가 제공하게 되었단 측면에서 이 역시 나노의 유니크한 강점이 될 수 있습니다.

 

위에 열거한 두 경우를 제외하면 사실 나노는 (특히 가성비의 측면에서) 사용자들에게 어필하기 어려운 제품입니다. 물론 그 중에도 외형적인 면을 높이 사 나노를 사고싶어할 소수의 부류가 존재하겠고, 이들에 더해 위에 열거한 두 그룹의 사용자들을 합친 수가 AMD가 나노를 통해 공략할 수 있는 최대한일 것입니다. 문제는 과연 이들만을 공략하는 것이 과연 현명한 전략이냐는 점인데, 바로 이 지점에 AMD의 숨은 의도가 있습니다. ITX 폼팩터 자체의 저변을 넓히겠다는 것, 나아가 그러한 컨셉의 (소형 폼팩터이거나, 플롭스 머신이거나, 혹은 둘 다이거나) 커스텀 시장을 확대해 보겠다는 것. 이것이 얼마나 잘 먹혀 들어가는지에 AMD의 가까운 장래의 성패가 걸렸다고 봐도 틀리지 않을 것입니다.

 

이상으로 리뷰를 마칩니다. 개인적으로는 (MakeItNano 프로젝트에 합류한 것이 8월 10일이었으니) 정확히 한달 걸렸던 긴 여정이 오늘로써 막을 내린 것이며, 여러분께 나노를 공개적으로 보여드린 8월 24일의 리뷰 1편을 기준삼더라도 3주간에 걸친 긴 리뷰 일정이었던 셈입니다. 기나긴 기다림의 시간을 견디고(!) 끝내 이 글을 읽어 주신 여러분께 대단히 감사드립니다.

 

//