Author : Daeguen Lee
(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)
※ 2편 (CPU & HSA편) 은 다음 링크에서 보실 수 있습니다 -> http://iyd.kr/614
"AMD Kaveri Review"
Introduction
엠바고가 해제된 지 무려 만 하루가 지난 이제야 리뷰를 보여드리게 되었습니다. 반갑고 후련한 마음보다도 왜 좀더 일찍 준비해 어제 공개하지 못했을까 하는 아쉬움이 남습니다. 죄송합니다^^;
이 리뷰는 1부 / 2부로 구성되어 있으며, 오늘 보여드릴 1부는 카베리의 GPU로써의 성능을 검증하는 장입니다. 다음주에 올릴 2부는 카베리의 CPU로써의 성능 및 카베리의 중요한 특징인 HSA에 관해 다뤄 볼 예정입니다. 그간 제 리뷰에 빠지지 않던 이론적 배경 등의 "썰" 들은 2부에서 풀어 보도록 하고, 오늘은 최대한 짧고 굵게 핵심만 짚고 넘어갑시다.
아래는 테스트에 사용된 시스템입니다.
AMD측 대조군은 "세대간 기본기 대결" 및 "전/현세대 최고성능 대결"이라는 양대 축을 중심으로 이야기를 서술할 수 있게 구성하였습니다. 우선 세대간 대결은 1세대 APU인 라노 기반의 A8-3870K, 2/3세대의 A10-6800K, 그리고 4세대 카베리를 대표하는 A10-7850K 이 셋을 통해 펼쳐집니다. 각 세대별 플래그십 APU이던 이들끼리의 비교를 통해 AMD의 APU가 얼마나 견실하게 발전해 왔는지 가늠해 보실 수 있을 것입니다.
두번째 테마인 "전/현세대 최고성능 대결"은 직전세대 플래그십인 A10-6800K와 A10-7850K 사이의 심화된 대결입니다. AMD의 APU는 단순히 GPU를 내장한 CPU일 뿐만 아니라, 자사의 엔트리 레벨 외장형 그래픽카드와 조합했을 때 "듀얼 그래픽" (= 구 하이브리드 크로스파이어) 이라는 기술을 적용해 별도의 CPU에 해당 그래픽카드를 조합한 것보다 더 높은 성능을 발휘할 수 있는데, A10-6800K의 경우 이렇게 조합 가능한 그래픽카드 중 제일 높은 모델이 라데온 HD 6670이고 A10-7850K의 경우 그보다 상급인 라데온 R7 시리즈까지 조합이 가능합니다. 즉 기본기 비교에서 한걸음 더 나아가 해당 APU로 구현할 수 있는 마지막 한 방울의 성능까지 짜내 비교해 보는 것으로 생각하시면 되겠습니다. 그럼 여기서 잠깐 실험 타임.
현재 라데온 R7 시리즈를 구성하는 라인업은 아래와 같습니다.
- R7 260X : 896SP
- R7 260 : 768SP
- R7 255 (또는 250X) : 512SP
- R7 250 : 384SP
- R7 240 : 320SP
여기서 R7 260/260X는 Bonaire, 255는 Verde, 250/240은 Oland GPU를 사용하므로 R7 시리즈에만 무려 3종의 GPU가 투입되는 셈입니다. 원래 크로스파이어는 동종의 GPU 사이에서만 구성이 가능한데, 듀얼 그래픽은 그보다는 조금 더 융통성이 있기는 합니다만(예 : VLIW4 기반의 GPU를 내장한 트리니티/리치랜드 APU는 VLIW5 기반의 라데온 HD 5600/6600 시리즈와 조합이 가능) 그렇더라도 소위 '급'이 다른 GPU와는 조합이 어려울 것이라 짐작할 수 있습니다. 하여 R7 250/260/260X 및 R7 255와 동등한 스펙을 갖는 7750을 사용해 실험해 본 결과...
- R7 260/260X : 불가능
- 7750 (= R7 255) : 불가능
- R7 250 : 가능
...따라서, A10-7850K와 듀얼 그래픽을 구성할 파트너는 최종적으로 R7 250으로 결정되었습니다. 이 녀석은 384SP/24TMU/8ROP를 탑재하여 7730과 스펙은 동일하고 조금씩 클럭이 상향된 버전입니다. 즉 사실상 7730의 오버클럭 버전으로 받아들여도 문제는 없지만, 7730이 Verde GPU(풀 스펙은 640SP/40TMU/16ROP)의 다운스펙 버전임을 생각하면 출신성분은 전혀 다른 제품입니다. (그 말인즉, R7 250과 동급이라고 하여 7730으로도 듀얼 그래픽을 구성하는 것은 불가능하다는 얘기)
그리고 위의 표를 보면 카베리만 다른 대조군보다 낮은 램 클럭이 적용되어 있습니다. 원래 APU 테스트이니만큼 최대한 높은 램 클럭 하에서 벤치마크를 진행하려 했지만, 다른 대조군에서는 잘만 되던 2400MHz 세팅이 카베리 플랫폼에서는 안정적으로 작동하지 않았습니다. (사용한 램도 일부러 핸드픽해둔 거였는데...) 램타를 푸네 전압을 퍼먹이네 별 짓을 다 하다가 결국 리뷰의 주인공에 대한 역차별을 감수하고 카베리에 한해 램 클럭을 2133MHz로 낮추게 되었습니다. 모든 내장그래픽 대조군을 동등한 램 클럭으로 맞추면 카베리가 좀 더 높은 포지션이 될 가능성이 있음을 미리 숙지하시기 바랍니다.
그리고 지포스 GT 630/640을 섭외하다가 발생한 작은 빡침.
............
다행히 다나와 상품 리스트를 참고한 결과, 시장에서 많이 팔리는 모델들은 한 가닥으로 정리가 되는듯 하여 최종적으로 낙점한 것이 빨간 네모로 표시한 모델입니다. 사족을 좀 달자면, GT 640은 동일한 모델 넘버를 유지하면서 사실상 다운스펙을 단행했다는 점, 그리고 GT 630은 같은 모델넘버 안에 신/구 아키텍처가 혼재한다는 점. 혹시라도 이들을 구입할 예정이시라면 반드시 주의하셔야겠습니다. 제가 사용한 GT 630 GDDR5는 페르미 기반의 GF108 GPU를 탑재하고 있는데, 엔비디아가 케플러 아키텍처를 도입하며 SP 갯수를 크게 늘리는 대신 개별 SP의 속도를 낮춘 탓에 실상 스펙상의 차이만큼 성능 차가 나지는 않습니다. (물론 외견상 스펙이 무지 초라해 보이기는 하네요) 게다가 이 GT 630은 128비트, 비교 대상인 GT 640은 64비트... 아... 여기 족보 왜이래...
본격적으로 벤치 결과를 보기 앞서, 그래픽카드 성능 방정식을 이용해 간단히 카베리 내장그래픽의 성능을 계산해 보았습니다. 이를 통해 대략적으로 어느 정도의 성능을 갖는지, 특히 오늘 테스트하지 못한 A10-7700K 이하 하위 버전의 카베리에 내장되는 GPU의 성능은 어떠한지도 간단히 살펴보시기 바랍니다. 우선 A10-7850K에 내장된 GPU입니다. 8개의 그래픽 코어를 내장해 총 512SP/32TMU를 가집니다.
▲ A10-7850K의 내장그래픽은 7730보다는 약간 낮고, R7 240보다는 높은 성능을 보일 것으로 예상됩니다. 아무래도 GPU의 스펙을 빈약한 ROP와 메모리 대역폭이 발목잡은 듯한 느낌입니다. 특히 APU의 특성상 시스템의 저대역 DDR3 메모리를 사용하는 핸디캡이 작용하는 한, 512개의 스트림프로세서라는 스펙이 왠지 쓸모없이 거대해 보이기까지 합니다. 만약 그렇다면, 7850K보다 더 적은 6개의 그래픽 코어를 내장해 384SP/24TMU를 갖는 7600/7700K 등이 더 경제적인 것 아닐까요. 아래는 A10-7700K / A8-7600K에 내장된 GPU의 성능입니다.
▲ 보시다시피 A10-7850K와의 내장그래픽 성능 차이는 7% 정도밖에 나지 않습니다. 스트림프로세서 갯수가 무려 30% 넘게 차이남에도 불구하고, 낮은 메모리 속도로 인해 그 이득은 크지 않다는 점을 다시 한번 확인할 수 있습니다. 사실 7850K의 많은 스트림프로세서는 내장그래픽으로의 활용보다도, HSA의 상용화될 경우를 대비해 프로세서 전체의 연산 성능을 위해 유보해 두었단 느낌이 강합니다. (자세한 내용은 2부에서 다루겠습니다)
암튼. 주절주절 얘기가 길었고... 슬슬 결과를 볼 준비를 해 봅시다.
3DMark 11/13을 제외한 모든 게임은 1280 x 720 / 1600 x 900 두가지 해상도에서 테스트되었으며, 게임 내 옵션은 그간의 제 모든 그래픽카드 벤치마크가 그러했듯 피직스, 안티를 제외하고 모두 설정 가능한 최고값으로 설정하였습니다. 내장그래픽 벤치마크에 웬 풀옵이냐고 하실 분이 계실 수 있겠지만, 반대로 플레이 할 만한 프레임을 미리 확보해 두고 낮은 옵션에서 우열을 가리는 것이 과연 그래픽 벤치마크로써 의미있겠냐는 반문을 드려 보겠습니다. 이는 저의 지난 리뷰들과 일관성을 유지하려는 것이기도 하고, APU가 기존의 CPU + 외장 그래픽카드 조합에 맞설 수 있는지를 검증하기에 더 직관적인 기준이기도 합니다.
Result - 1. 3DMark 11
(Entry / Performance Preset)
▲ 그래프가 위아래로 길어 혹시 저해상도 모니터에서 보시는 분들은 불편하실 수도 있겠습니다. 대조군이 많은 탓이니 너그러이 양해해 주시면 감사하겠습니다. 보라색은 듀얼 그래픽 구성, 빨간색은 AMD 내장그래픽, 파란색은 인텔 내장그래픽, 녹색은 (플랫폼 구분 없이) 외장 그래픽카드로 얻은 결과입니다.
이제부터 코멘트는 최소화할 테니, 최대한 멀찍이 떨어져서 그래프의 색깔만으로 감상해 주셔도 되겠습니다.
2. 3DMark 13
(Cloud Gate / Fire Strike)
3. Aliens vs Predator
(Texture : Very High, Shadow : High, AF x16, SSAO On, Tessellation On, Advanced Shadow On, AA Off)
4. Batman : Arkham City
(DX11 Features : MVSS and HBAO, DX11 Tessellation : High, Detail Level : Extreme, AA & PhysX Off)
5. Bioshock : Infinite
(UltraDX11 with Diffusion Depth of Field)
6. Crysis : Warhead
(64bit, DX10, Enthusiast, AA Off)
7. DiRT : Showdown
(Ultra Preset, AA Off)
8. Hitman : Absolution
(Quality Level : Ultra, AA & FXAA Off)
9. Just Cause 2
(Texture/Shadow/SSAO : High, Water/Objects Detail : Very High, All others On except AA)
10. Metro 2033
(DX11 with DOF, Quality : Very High, AF 16x, AA & PhysX Off)
11. Metro : Last Light
(DX11, Quality : Very High, AF 16x, Motion Blur : Normal, Tessellation : Very High, AA & PhysX Off)
12. Sleeping Dogs
(Graphics Level : Extreme, AA : Normal)
13. Tomb Raider : Reboot
(Quality : Ultra, AA Off)
Performance Summary
지금까지의 결과를 각 해상도별로 한 장씩의 그래프로 요약해 보았습니다.
게임마다 조금씩 편차가 있기는 하나 종합적으로 A10-7850K의 내장그래픽 성능은 GT 640과 GT 630의 사이에 위치합니다. R7 250과 함께 듀얼 그래픽을 구성하면 7770 GHz Ed.과 거의 같은 수준이고, 특히 멀티 GPU를 지원하지 않는 배트맨 등을 제외하면 사실상 7770 GHz Ed.보다 더 높은 성능입니다. 장차 R7 250이 그 자리를 대체할 것으로 여겨지는 7730은 7만원. 7770은 12만원. 카베리가 품은 내장 그래픽이 5만원의 값어치를 하는지는 일차로 그 5만원이란 금액을 뺀 나머지 APU값으로 살 수 있는 다른 CPU보다 카베리가 얼마나 뛰어난지에 달렸고, 두번째로 포스트-HSA 시대에 진입하여 내장그래픽이 얼마나 잘 "코프로세서"로 기능할지에 달렸습니다.
Conclusion
개인적으로, 카베리를 한참 테스트하다 리치랜드나 라노로 넘어갈 때마다 "장동건을 보고 거울을 보니 웬 오징어가 있더라" 는 말을 뼈저리게 느꼈습니다. 불과 몇주 전까지만 해도 트리니티/리치랜드의 내장그래픽 성능이 좋은 편이라고 여겼단 사실이 도저히 믿기지 않을 만큼, 전세대 APU의 내장그래픽 수준을 '번데기 앞에서 주름잡는' 초라한 수준으로 격하시킨 카베리 내장그래픽의 위력은 현 시점에서 카베리의 가장 큰 자산이 아닐까요. 현재 다나와 기준 A10-7850K의 최저가는 18만원. 간단히 생각해 여기에 R7 250을 더한 값이 비슷한 성능의 CPU와 7770을 더한 값보다 비싸다면 소비자들에게 어필하기 상당히 어려울 것입니다. 결국 모든 열쇠는 가격에 달린 셈입니다.
한편, 리뷰 초반에 언급했듯 8개의 그래픽 코어를 탑재한 7850K와 6개의 그래픽 코어를 탑재한 7600/7700K의 내장그래픽 성능 차이가 실상 그리 크지 않을 것으로 전망되는데, 이 경우 전통적인 APU(이제 겨우 세상에 등장한 지 3년 남짓 될까말까한 개념에 "전통"이란 말을 붙이는게 좀 웃기긴 하지만-_-)가 담당하던 캐주얼한 AIO-PC 등의 용도에는 7850K보다도 7600등이 더 잘 맞을것 같습니다. 특히 A8-7600의 경우 CPU 클럭이 7700K보다 낮은 것을 제외하고는 내장그래픽 사양은 동일하고, 45/65W로 커스텀 가능한 TDP를 가지며, 가격이 120달러로 예정되어 있다는 점에서 상당히 매력적인 제품입니다.
지금까지의 썰을 종합해 보면 카베리 자체는 매력적(내장그래픽 성능도, 이후 연산용으로 전용 가능하다는 점도)임에 틀림없으나 A10-7850K이란 특정한 모델로서는 시장에서 그 입지가 굉장히 애매한 편입니다. 전통적인 APU 플래그십의 역할은 두 단계 아랫급인 A8-7600만으로 충분하고, 설상가상 7850K가 갖는 512개의 스트림프로세서 중 상당수는 그래픽 성능에 그다지 관여하지도 않습니다. 그렇다면 역시 7850K의 의의는 (통상적인 APU라기보다는) 그래픽 코어까지 연산용으로 활용하는 GPGPU, 그리고 포스트-HSA 시대를 대비하는 데 있는 것이 아닐런지요. 판단은 언제나 그렇듯 여러분의 몫입니다.
긴 글 읽어 주셔서 감사합니다. 좋은 하루 되세요!
※ 2편 (CPU & HSA편) 은 여기서 보실 수 있습니다 -> http://iyd.kr/614
//
(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)
'Review > cpu_review' 카테고리의 다른 글
서자들의 전쟁 : 카비니 vs 베이트레일 (21) | 2014.08.27 |
---|---|
AMD 4세대 APU 카베리 리뷰 : (2) CPU & HSA 편 (35) | 2014.01.23 |
2세대 불도저, AMD 파일드라이버 리뷰 (5) (完) (17) | 2012.10.23 |
2세대 불도저, AMD 파일드라이버 리뷰 (4) (0) | 2012.10.23 |
2세대 불도저, AMD 파일드라이버 리뷰 (3) (0) | 2012.10.23 |