본문 바로가기

Review/cpu_review

AMD 4세대 APU 카베리 리뷰 : (2) CPU & HSA 편

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)

 

※ 1편 (내장그래픽 편) 은 다음 링크에서 보실 수 있습니다 -> http://iyd.kr/611

AMD Kaveri Review - Part 2 : As CPU

 


Introduction



1부를 올릴 당시엔 분명히 "다음주 이 시간" 에 2부를 올리겠다고 공언했지만, 어쩌다 보니 거기에 +24시간이 경과한 지금에야 2부를 올리게 되었습니다. 이미 공지했듯 2부에서는 카베리의 CPU 측면에서의 성능 및 AMD가 카베리에 야심차게 적용한 HSA에 관해 다루게 됩니다. 실은 이 HSA란 것을 적용함에 있어, 인프라 자체가 '이미 다 된' 상황이 아니라 '되어가고 있는(on-going)' 상황이다 보니 테스트가 진행되는 도중 변경점이 생겨나고, 그 부분을 다시 테스트하고... 이런 사정이 있어 스케줄이 지연되게 되었습니다. 하여 1부를 올리던 지난주처럼, 저는 지금도 이틀 밤을 새고 다시 3일차의 밤을 맞은 상태입니다.


이번에도, 많은 분들이 궁금해하실 결과 자체를 제일 빨리 소개해드리도록 하고, 사진 및 코멘터리 등 디테일한 부분은 리뷰 등록 후 실시간으로 보충하도록 하겠습니다. 그러는 편이 독자 여러분께도 더 좋겠죠? :-)

 

그럼 이런저런 서론은 생략하고... 바로 본론으로 들어가 봅시다!

테스트에 사용한 시스템 구성은 아래와 같습니다.

 

 

GPU 성능 테스트를 위해 내장그래픽으로만 테스트를 진행했던 전편과 달리, 카베리의 "CPU로써의" 성능을 검증하는 것이 이번 글의 목적이므로 GTX 780 Ti를 공통적으로 장착해 테스트를 진행했습니다. 이 결과 카베리를 제외한 APU, 인텔 CPU의 내장그래픽이 공식적으로 비활성화되었습니다.


즉 PCMark 등 OpenCL 가속을 사용할 여지가 있는 벤치마크 툴에서 내장 GPU의 조력을 받는 것이 불가능합니다. (다만 카베리는 HSA 활성화를 통해 코프로세서로 내장GPU를 활용할 수 있습니다) 다시 말해 -PCMark를 예로 들면- OpenCL을 활용하는 Accelerated 모드와 전통적인 Conventional 모드가 모두 제공되는데, HSA 테스트를 제외하고는 Conventional로 돌린 것을 원칙으로 했다는 얘기입니다.


보통 해외 벤치마크에서 OpenCL 가속이 가능한 벤치마크 툴을 쓴 경우는 하나같이 (외장그래픽 없이) 카베리+카베리 내장그래픽 vs 하스웰+하스웰 내장그래픽의 조합으로 테스트한 것 일색이라 CPU 성능을 있는 그대로 보여준다고 믿기 힘들었는데, 이에 이번 리뷰에서는 HSA 테스트를 제외한 모든 다른 테스트에서 OpenCL 가속은 사용하지 않는 것을 원칙으로 했습니다. (피직스를 CPU로 돌리는 것과 마찬가지로, CPU만으로 OpenCL 가속을 수행하면 어차피 성능이 오히려 떨어지는 이유도 있습니다)


게임 테스트에서의 방법론은 그간의 게임 벤치들과 동일합니다. 특별한 내용이 없으니 이 정도로 넘어가도 무방할것 같습니다. 게임 외의 테스트는 모두 3회 반복 후 중간값을 해당 대조군의 성능으로 간주했습니다.

 

 

Result - 1. Gaming


우선 첫 장에서는 게임 성능을 살펴보도록 하겠습니다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2. Arithmetic


이번 장에서는 각 대조군의 산술 연산 성능을 알아보도록 하겠습니다.

 

 

 

 

 

 

 

 

 

3. Multimedia


세번째 장에서는 피직스 연산, 인코딩, 렌더링 등 멀티미디어 성능을 살펴보도록 하겠습니다.

 

 

 

 

 

 

 

 

 

4. HSA Features


네번째 장은 사실 이번 리뷰의 하이라이트에 해당합니다. 바로 HSA의 실체를 규명하는 것!

 

HSA 활성화를 위해 레지스트리를 건드리고, IOMMU를 활성화하는 등 사전 정지작업이 몇가지 선행되어야 하는데, 아시다시피 해외에서도 전혀 다뤄지지 않은 부분이라 맨땅에 헤딩해가며 엄청난 시행착오를 겪어야 했었습니다. 그래도 최종 결과물을 얻어낸 지금 돌이켜보면 다 유익한 경험이었겠거니 생각됩니다. 추후 세부 설정에 관해서도 내용을 가다듬어 가이드 형식으로 본 리뷰에 보충하도록 하겠습니다.

 

 

우선 앞서 등장한 바 있던 산드라가 재출연했는데, 원래 이 항목은 GPGPU 벤치마크입니다. 즉 전통적인 CPU 성능을 측정하기엔 알맞지 않으나, 제가 보여드리고자 하는 것은 기존의 APU들과의 격차입니다. 보시다시피 HSA가 활성화된 경우 단순히 내장 GPU를 사용해 GPGPU 연산을 수행하는 수준을 훨씬 넘어선 격차를 보이고 있습니다.

 

 

 

 

PC마크의 결과도 상당히 큰 성능향상을 보여줍니다. (비록 탐스하드웨어 등 해외발 카베리 벤치에서 카베리가 하스웰을 앞서는 지표로 가장 빈번하게 언급된 것이 PC마크이지만, 각자의 내장그래픽으로 테스트되었단 점을 잊어선 안 되겠습니다)


본 리뷰에서는 공평하게 GTX 780 Ti로 통일 후 모든 테스트를 진행한 바, 냉정하게 말하자면 전통적인 의미의 CPU 성능에 있어서 카베리는 하스웰의 적수가 못 됩니다. 심지어 자사의 전세대 아키텍처에 기반한 리치랜드와도 상당히 힘겨운 싸움을 벌이고 있다고 봐야겠죠. 하지만 정말 놀라운 부분은 HSA 적용시의 성능입니다. Home Suite를 제외한 나머지 두 항목에서 하스웰을 뛰어넘는 성능을 보이고 있으며, HSA 미적용시와 비교했을 때 성능향상폭은 최소 40% 정도에서 최대 70% 정도에까지 이르고 있습니다. 과연 실사용 프로그램에서는 어떠한 결과를 보여줄까요.

 

 

 

 

보시다시피, HSA 적용시 상당히 큰 폭의 성능 향상이 일어납니다. 앞에서도 언급한 바 있지만, HSA는 단순히 내장 GPU로 GPGPU 연산을 돌리는 것과는 또 다른 레벨에서 CPU와의 시너지를 창출합니다. 특히 기존의 내장그래픽과 달리 외장 그래픽카드를 장착한 뒤에도 내장 GPU를 활용할 수 있다는 점에서, 전통적인 의미의 -문자 그대로- "내장 그래픽" 이라기보다는 정말 별도의 코어, 혹은 코프로세서(Co-processor) 개념에 더 가까워 보이기까지 합니다.


HSA의 저변이 확충되어 전통적인 의미에서의 "싱글 스레드" 성능까지 끌어올릴 수 있다면 좋겠지만 현실적으로 -적어도 아직은- 그것까지는 어려워 보이고, 현 시점에서 여러분이 사용하는 프로그램이 HSA를 지원하거나, 지원할 것을 공언한 경우라면 카베리가 상당히 매력적인 "CPU" (CPU로서의 CPU) 가 되지 않을까 생각됩니다. 물론 HSA와 거리가 먼 용도라면 카베리를 살지 말지 고민하는 것보다도 오히려 리치랜드를 두고 고민하는 게 더 합리적인 행동이라는, 상반된 두 전망을 함께 제시해 보겠습니다.

 

 

Performance Summary


지금까지 살펴본 모든 벤치마크 결과를 각 분야별로 요약해 보았습니다.

 

 

 

 

 


Conclusion 



지금까지의 분석을 통해 보셨다시피 전통적인 의미에서의 CPU에 그 용도를 한정한다면 카베리를 구입하는 것은 그리 현명한 선택이 아닙니다. 특히 게임 성능에서는 하스웰들은 둘째치고 자사의 전세대 제품인 리치랜드에 대해서도 뚜렷한 우위를 확보하지 못하는 어정쩡한 모습을 보이고 있습니다. 즉 (CPU로서든 GPU로서든) '전통적인' 컴퓨팅 영역에 한정해놓고 보자면 카베리의 존재가치는 리치랜드보다 더 나은 내장그래픽 성능, 그리고 그 성능 차이가 현재 시장에서 형성된 가격 차이가 되기에 합당한지의 여부에 달려 있을 것입니다. 개인적으로는 내장그래픽 성능이 나아졌다고 해서 5만원 이상을 지불하고 싶은 생각은 없습니다. (아주 솔직한 생각입니다 -_-;)


다만, HSA의 영역에서 바라볼 때 카베리는 지금까지와는 전혀 다른 패러다임에서 비춰질 수밖에 없는데, 이 경우 전통적인 용어로 설명되는 4코어/ 512SP라는 말보다도, "12코어 (4+8)"에 더 가까운 행태를 보이기 때문입니다. 분명 카베리의 내장 그래픽 유닛은 전통적인 GPU 역할 그 이상을 수행하며, 드라이버상의 지원이 있다는 전제 하에 프로그램 레벨에서 HSA를 구동하는 데에는 거의 어려움이 없었습니다. (물론 제가 프로그래머라면 그런 프로그램을 만드는 것부터 어려웠을 수 있겠습니다만...) 상대적으로 낮은 진입장벽과 사실상 거의 모든 단말 진영이 HSA Foundation에 참여하고 있다는 점은 카베리에게(그리고 그 후계자가 될 제품들에게) 큰 자산이 아닐까 합니다.


 

결국 비슷비슷한 말들을 이 글 내내 한 기분인데, 카베리의 장단점을 간단히 요약하면 아래와 같습니다.


장점

내장그래픽 솔루션으로는 최고 수준의 내장그래픽 성능

HSA 적용시의 높은 성능. 비단 '향상폭'이 높을 뿐만 아니라 절대적인 성능 자체도 매우 고성능

리치랜드와 동일한 CPU 성능을 유지하면서 소비전력이 낮아짐


단점

리치랜드와 비교시 CPU 부분의 발전이 사실상 없음 (IPC 상승과 클럭 감소가 거의 정확히 상쇄)

오버클럭이 어려움. (리뷰에서는 다루지 않았지만, 오버클럭 및 램오버가 굉장히 어려웠습니다)

'전통적인' 영역에 한해 보면 성능에 비해 값이 비쌈

 

공부도, 스포츠 경기도 결국 가장 어려운 상대는 자기 자신이라는 말이 있듯, 현재 카베리의 안착에 가장 위협이 되는 상대는 인텔  i5도, i3도 아닌 다름아닌 자사의 전세대 동일 라인업들 -리치랜드 6800K, 6790K, 6700 등등- 이 아닐까 합니다. 이들에 대해 확고한 비교우위를 구축하지 않는 한, 혹은 가격이라도 파격적으로 (적어도 비슷한 수준까지) 매겨지지 않는 한 예비 구매자들에게 카베리란 이름 석자를 어필하는 것은 상당히 어려운 일일 겁니다. 개인적으로는 전통적인 영역에서의 매력 없는 성능에 불구, HSA라는 새로운 영역을 개척했다는 점이 매력적으로 느껴지지만 저 이외의 유저분들 중 저와 같은 부분에서 매력을 느끼는 분이 많지는 않겠죠. 결국 얼마나 광범위한 유저층에게 매력으로 다가갈 수 있는지가 카베리에게 남은 숙제이고, 다른 무엇보다 HSA의 패러다임이 빠른 속도로 전파되는 것이 관건이리라 생각합니다.


뭐, 그간의 다른 리뷰에서 늘 반복한 결론이지만... "판단은 여러분의 몫".

긴 리뷰 읽어 주셔서 감사합니다 :-)


※ 1편 (내장그래픽 편) 은 여기서 보실 수 있습니다 -> http://iyd.kr/611

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)