본문 바로가기

Review/vga_review

응답하라 1999 : 라데온 R9 Fury X 리뷰

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source)

 

 

 

 

안녕하십니까 독자 여러분. GTX 980 Ti 리뷰를 올린지 3주 남짓한 기간만에 새로운 그래픽카드를 들고 여러분을 찾아뵙게 된 글쓴이입니다.

 

2009년 연말을 기점으로 DirectX 11 지원 그래픽카드가 양산되기 시작한 이래 만 5년을 훌쩍 넘긴 지금에서야 AMD와 엔비디아 양사는 DirectX 12로의 이전을 꾀하고 있습니다. 아시다시피 DirectX 11의 단점으로는 지나친 싱글코어 의존성과 과도한 API 오버헤드, 그에 따른 '그래픽카드 외적 요소에 의한' 게임성능의 좌우 등을 꼽을 수 있겠습니다. 이러한 단점은 특히 CPU의 발전이 정체되기 시작한 시기와 맞물려 상당히 오랜 기간 게이머들의 '게임 경험'의 신장을 방해하는데 일조한 바 있으며, 같은 기간 동안 그래픽카드의 절대성능이 얼마나 향상되었는지와 별개로 '차세대 게이밍 경험'을 위해서는 반드시 극복되어야 할 과제로 지목되기에 이르렀습니다. 이를 탈피하기 위한 그래픽카드 제조사의 몸부림은 작년 초 AMD의 맨틀 API 제안으로 표면화되었으며, 이에 자극받아 MS 역시 맨틀이 추구한 여러 개혁요소를 가미한 DirectX 12를 발표함으로써 비로소 전면적인 세대교체가 눈 앞에 다가왔습니다.

 

AMD와 엔비디아 양사 역시 이러한 움직임에 호응하여, 엔비디아가 반발짝 앞서 DirectX 12 지원을 내세운 맥스웰 아키텍처를 지난 연말 발표한 바 있으며 AMD 역시 3세대 GCN 아키텍처를 차근차근 준비해오고 있었습니다. 엔비디아가 인텔의 틱톡처럼 매 2년마다 단숨에 새 아키텍처를 도입하는 것과 달리 AMD는 GCN이라는 큰 틀을 몇년간 유지하며 그 안에서 새로운 기능들을 추가하는 방식으로 경쟁사의 행보에 대응해 왔는데, 오늘의 주인공인 R9 Fury X에 탑재된 AMD의 최신 GPU "Fiji XT" 역시 이러한 '점진적 개혁'의 최전선에 서 있는 제품이라 할 수 있겠습니다. 즉 페르미-케플러-맥스웰에 이르는 엔비디아의 변화상과, GCN이라는 한 지붕 아래에서 타히티-하와이-피지로 모습을 바꿔 온 AMD의 변화상을 비교해보는것 역시 상당히 재미있는 분석이 되지 않을까 생각합니다.

 

Fiji XT, 줄여서 '피지'는 기본적으로 하와이의 구조를 많은 부분 답습하고 있습니다. 우선 아래 이미지를 보고 설명을 이어가도록 하겠습니다.

 

 

하와이와 동일한 4개 '쉐이더 엔진', 하와이와 동일한 8개 ACE(Async Compute Engine), 심지어 ROP 갯수마저 하와이와 동일한 64개입니다. 과거 하와이 리뷰(http://iyd.kr/555)에서 타히티 대비 2배로 증가한 ROP에 대해 언급하며, 'SP 갯수가 37.5%가량 증가한 데 비해 ROP가 100% 증가했으니 연산성능의 향상보다도 게임성능의 대폭적인 향상이 기대된다' 는 취지의 언급을 했었는데, 이번에는 정확히 반대의 분석을 할 수밖에 없겠습니다. SP 갯수는 하와이의 2816개에서 4096개로 약 40%가량 증가했으나 ROP 갯수가 전혀 늘지 않았기 때문이죠. 역사적으로 게이밍 성능은 SP 갯수보다는 ROP 갯수에 의존해 왔으며, 그러한 '역사' 가 이번에도 이어질지가 오늘의 R9 Fury X 리뷰의 핵심이 될 것입니다.

 

이상으로 간단한 배경 설명을 마치며, 비하인드 스토리를 잠시 언급하자면 엠바고보다도 상당한 시일 전 벤치마크를 완료한 상태였으나, 그로부터 어제 정식으로 엠바고가 해제되기까지의 시간 동안 새로운 리뷰어용 드라이버가 제공된 바 있는데 그로 인한 성능변화 때문에 결국 막판에 엄청난 작업량을 감당해야만 했습니다. 결과적으로 처음 제가 소개하려던 성능과 지금의 성능 사이에는 상당한 차이가 있게 되어 (단순히 성능의 절대값만 다른 게 아니라, 전체적인 '양상' 이 달라졌습니다) 섣불리 결과를 공개하지 않고 이 시간까지 기다리길 잘 했단 생각이 듭니다. 까딱했다간 특급 오보를 낼 뻔...

 

백문이 불여일견이라고 하죠. 지금부터 올해 상반기의 최대 기대작인 AMD 라데온 R9 Fury X 리뷰를 보여 드리도록 하겠습니다. 우선 전체 리뷰의 요약본인 Executive Summary입니다. (※ 본 리뷰의 목차는 아래와 같습니다.)

 

<목차>

 

1. Executive Summary

2. Photo Gallery

3. Benchmark Result

4. Performance Analysis

5. Conclusion

 

 

1. Executive Summary


결론부터 말하자면 R9 Fury X는 경쟁사의 최상위 그래픽카드인 GTX TITAN-X를 압도하는 데 실패했습니다. FHD 해상도 기준으로 R9 Fury X는 TITAN-X의 90%에 해당하는 성능을 보이고, QHD에서는 그 차가 줄어들어 약 96%에 해당하는 성능을 보이기는 하나 분명 TITAN-X보다 떨어지는 성능입니다. 하지만 UHD로 시선을 옮기면 R9 Fury X가 높은 메모리 대역폭에 힘입어 TITAN-X를 넘어서는 성능을 보이는 것 또한 확인할 수 있습니다. 5K 및 8K 해상도에서 '모든 게임'의 벤치마크가 진행되지 못해 이 장에서는 해당 해상도에서의 성능 그래프가 빠져 있지만, 3DMark 장 및 배틀필드 4 / 스나이퍼 엘리트 3 장에서 5K 및 8K 해상도에서의 성능을 확인해 보면 고해상도로 갈수록 높은 상대성능을 보이는 R9 Fury X의 특성이 더욱 두드러집니다. (다만 메모리 용량 자체가 4GB에 그쳐 8K 해상도에서의 3DMark 점수는 뚜렷한 한계를 보이기도 했습니다.)

 

 

종합적으로 보아 R9 Fury X의 경쟁 제품을 TITAN-X로 볼 것인지 / 980 Ti로 볼 것인지에 따라 이 제품에 대한 평가는 달라질 것입니다. TITAN-X와 비교한다면 위의 3개 시나리오 중 2개 시나리오에서 지고 1개 시나리오에서 신승을 거두는 것 뿐이지만 980 Ti와 비교하면 FHD에서만 5%p 가량 떨어질 뿐 나머지 두 해상도 (QHD / UHD) 에서는 R9 Fury X가 앞서는 성능을 보여주기 때문입니다.

 

 

한편, 게임성능 이외의 요소로 GPU 연산성능과 소비전력을 간단히 살펴본 결과는 위와 같습니다. 대조군 중 가장 많은 4096개의 코어에 힘입어 R9 Fury X는 압도적인 연산성능을 보이고 있으며 소비전력은 TITAN-X와 980 Ti의 정 중앙쯤에 위치합니다. 전력을 적게 먹는다고는 할 수 없겠으나 자사의 전세대 플래그십인 하와이와 비교하면 비약적으로 전성비가 향상되었다고 볼 수 있습니다.

 

 

2. Photo Gallery


개인적으로는 R9 Fury X의 외형이 대단히 마음에 들었습니다. 사진으로 전해지는 느낌과는 또 달리, 실제로는 굉장히 -마치 유니바디인 애플 제품처럼- 견고하고 짜임새있게 생겨 누가 보더라도 '얘는 바람 한점 안 통하게 생겼다' 하는 생각이 듭니다. 물론 ('하이브리드'조차 아닌) 완전한 수냉 쿨링 방식을 채택했기에 가능한 외관이지만, 기존의 '어딘가 싸 보이는' AMD의 레퍼런스 마감과는 현격한 차이를 보여주는 하우징만으로 상당히 마음을 뺏고 들어갑니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

이상으로 외형 소개를 마치며, 벤치마크 결과를 살펴보도록 하겠습니다.

 

 

3. Benchmark Result


우선 첫 벤치마크로 3DMark 결과를 살펴봅시다. 아시다시피 3DMark 시리즈는 게이밍 벤치마크계의 고전이며, 과거 밴티지 버전까지는 실제 게임성능보다 GPU의 연산성능에 의존적인 결과를 뽑아내는 것으로 비판을 받았으나 11 버전부터는 그러한 면모에서 멀찍이 떨어진, 실제 게임성능 평균치와 상당히 유사한 결과를 보여주고 있기도 합니다. 과연 이러한 모습이 신상 R9 Fury X에도 유효할지, 한번 살펴봅시다.

 

 

우선 3DMark 11과 Sky Diver의 결과입니다. FHD급 이하의 게이밍 성능을 대표하는 테스트라고 볼 수 있겠습니다.

결과 자체는 상당히 의외입니다. 과거 '연산성능에 의존하는' 3DMark의 모습을 굳이 떠올리지 않더라도, 스트림프로세서를 4096개나 탑재한 피지가 '명목상으로라도' 최고 점수를 받아내지 못한 게 의아하기까지 합니다.

 

 

반면 3DMark Fire Strike에서는 위와 같이 단편적으로 결과를 요약하기엔 다소 복잡한 면모가 나타납니다. 해상도가 올라갈수록 R9 Fury X의 성능이 오르는 경향이 매우 뚜렷하기 때문입니다. 흔히 ROP가 게임 성능에 큰 영향을 주는것으로 알려져 있으나 정확히 표현하자면 'ROP와 메모리대역폭 덩어리' 가 큰 영향을 미치는 것입니다. 과거 이 둘을 명확히 구분할 필요가 없던 것은 태생적으로 많은 ROP를 가진 GPU가 높은 대역폭을 갖게끔 설계되어 왔기 때문이며, 심지어 엔비디아는 오늘날까지도 ROP와 메모리컨트롤러를 아예 하나의 블록으로 묶어 유닛화하고 있기까지 합니다. 즉 ROP가 전세대 수준에 머물면서 메모리 대역폭만 폭발적으로 증가한 피지의 케이스가 대단히 이례적인 것이며, 이해할 수 없는 성능특성 역시 어느 정도 이에 기인한다는 점을 숙지하고 앞으로의 결과를 보시면 좀더 깊이 피지의 특성을 이해하실 수 있으리라 생각합니다.

 

이상으로 3DMark 결과를 모두 보았습니다. 본격적으로 게임 벤치마크 성능을 살펴봅시다. 각 게임별 코멘트는 생략하고, 모든 게임을 살펴본 뒤 뭉뚱그려 설명을 적어넣도록 하겠습니다.

 

 

 

 

 

 

 

 

 

 

 

 

12개 게임 벤치마크 결과를 모두 보셨습니다. 타이틀 중 배틀필드 4와 스나이퍼 엘리트 3만이 8K까지의 시나리오를 모두 소화할 수 있었는데, 전체적으로 모든 게임 & 모든 해상도에 걸쳐 "해상도가 올라갈수록" R9 Fury X의 상대적인 성능은 분명히 상승곡선을 그리고 있습니다. 해상도가 올라갈수록 그래픽메모리 대역폭이 중요한 요소로 작용한다는 점을 아주 명확히 보여주는 것입니다.

 

그러나 8K 해상도에서 쪼그라든 점수를 보여준 3DMark Fire Strike라든지, 4K를 넘어서자 오히려 순위가 내려간 배틀필드 4의 결과에서 보듯 R9 Fury X는 뚜렷한 한계 역시 동시에 보이고 있습니다. 바로 VRAM의 절대용량 자체입니다.

 

 

4. Performance Analysis


이상의 12개 게임 + 3DMark 벤치마크 결과를 모두 망라하여, 해상도별 성능 분석을 시도해 보았습니다.

 

 

우선 FHD에서의 게임 성능을 보면 R9 Fury X는 명백히 TITAN-X / 980 Ti에 뒤처지는 성능을 보여줍니다. 비록 980보다 980 Ti에 가깝다는 점으로 위안삼을 수 있을지 모르겠으나, 일년 반을 끌어온 AMD의 신상 플래그십이라는 점을 생각하면 분명 실망스러운 점수라고 해야겠습니다. TITAN-X를 100%p로 두었을 때 R9 Fury X는 90%p에 해당하는 성능이며, 980 Ti는 그 둘의 정가운데인 95%p 지점에 자리잡고 있습니다.

 

 

QHD로 해상도를 높여 보자 양상이 살짝 바뀌었습니다. 근소한 차이로나마 R9 Fury X는 980 Ti를 앞서는데 성공했고 (불과 1%p 차이입니다만), TITAN-X와의 격차도 FHD에서 10%p이던 것을 4%p까지 좁히고 있습니다.

 

 

이러한 '고해상도 역주행' 추세는 UHD에서 두드러집니다. TITAN-X를 3%p 차이로 앞지르고 R9 Fury X가 현존하는 최고성능의 VGA에 올라선 것입니다.

12개 게임 타이틀에서 상위 3개 그래픽카드가 보인 평균 프레임수는 R9 Fury X가 약 59프레임, TITAN-X가 57프레임, 980 Ti가 54프레임으로 셋 모두 어느 정도 단독으로 4K 게이밍이 가능한 수준이라 할 수 있습니다.

 

 

5. Conclusion


정리해 봅시다. R9 Fury X는 AMD의 최신 GPU인 피지를 탑재했는데, 이 GPU의 특징은 다음의 세 가지로 요약됩니다 : 4096개의 어마어마한 코어 갯수에서 발휘되는 역대 최고급 연산성능, 그와 반대로 전세대 수준에 머무른 ROP 갯수, HBM 탑재로 대폭 증가한 메모리 대역폭이 그것입니다. 3가지 요소가 모두 조금은 '따로 논다' 는 느낌을 지울 수 없는데, 특히 전통적으로 ROP 성능과 메모리 대역폭이 한 묶음으로 성장해 온 패턴을 정면으로 부정하는 피지의 '비대칭적 진화' 는 이러한 모순을 극명히 보여줍니다. 전체적으로 살펴본 게이밍 성능은 단 한가지 특성으로 요약하는 것은 불가능하고, 해상도에 따라 살펴볼 수 있겠는데,

 

- 저해상도 (FHD) 의 실망스러운 성능

- 고해상도 (UHD) 의 만족스러운 성능

- 초 고해상도 (5K / 8K) 의 아쉬운 성능

 

으로 각각 요약할 수 있겠습니다. 특히 해상도가 오름에 따라 성능을 발휘하게끔 GPU를 설계해 두고, 정작 메모리를 4GB "밖에" 탑재하지 않아 기껏 올라가던 성능곡선을 5K / 8K 에서 다시 꺾어버린 점은 대단히 아쉽습니다. 개인적인 견해를 덧붙이자면 8GB HBM을 탑재한 피지가 상용화된다면 비로소 지금의 아쉬운 면을 거둬내고 재평가할 수 있지 않을까 생각될 정도입니다.

 

 

한편, 이 제품 리뷰와는 엄밀히 말해 상관없는 부분이나 글쓴이가 고안해 몇 차례 소개한 바 있는 'VGA 계산기' 를 이 글 말미에 언급하고자 합니다.

 

R9 Fury X의 (지금 최종적으로 공개된) 실제 성능보다 뛰어난 성능값을 갖고 있던 당시, VGA 계산기에 대입해 본 R9 Fury X의 성능은 거기에 크게 못 미쳤을 뿐 아니라 심지어 980 Ti보다도 뒤떨어지는 것으로 나타났습니다. 신 아키텍처의 도입이 종종 부정확한 결과를 얻어낸 것이야 그리 놀라운 일이 아니었으며, 개인적으로 HBM의 도입은 아키텍처 혁신에 준하는 큰 변화로 생각했기에 그에 따른 계산방식 변화가 반영되지 않은 탓에 '비정상적으로' 성능이 낮게 계산된 것이라 치부해 버렸습니다.

 

그런데, 엠바고가 풀리고 세계 각지의 리뷰를 돌아다니며 본 결과...... 저보다도 제 피조물이 더 좋은 촉을 가졌다는 걸 인정하지 않을 수 없었습니다. 물론 고해상도로 갈수록 피지의 상대성능은 분명이 상승하는 특성이 있으며, 이는 역대 GPU 모두 ROP와 메모리 대역폭이 각각 성능에 미치는 영향이 명확히 분리규명되지 않았던 탓이고, 앞으로 방정식의 업데이트에 금번 피지의 존재가 대단히 유용하게 쓰일 것이라 여겨지는 이유이기도 합니다. (피지같은 예외가 등장함으로써 비로소 ROP와 메모리 대역폭의 성능영향평가를 명확히 분리해낼 수 있게 되었습니다.)

 

이 역시 백문이 불여일견. 제 방정식이 오래 전부터 계산해냈던 R9 Fury X의 성능값을 소개하며 이 글을 마치도록 하겠습니다.

 

 

긴 글 읽어주셔서 감사합니다. 좋은 하루 되세요 :)

 

//