본문 바로가기

Lecture & Column/ict_lec_col

모바일 SoC의 모든 것 : May 2015

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)

 

 

 

 

안녕하세요 독자 여러분. 이 글의 모든 내용은 위 그림 한 장으로 요약됩니다.

구태여 길게 설명하지 않겠습니다. 앞으로 한달에 한번씩, 모바일 SoC 비교표를 업데이트해 소개합니다.

원래 창간호가 선물도 많이 주는 법이니 특별히 아직 출시되지 않은 SoC들의 스펙과 예상 성능도 아래에 열거해 보았습니다.

 

위 그림에 다 요약돼 있으니 무슨 말을 해도 새롭지 않을 것 같은데, 비교 대상은 삼성 / 애플 / 퀄컴 / 엔비디아 / 미디어텍의 'Cortex-A15급 이상 쿼드코어' SoC로 정했습니다. 다만 애플의 경우 타 SoC 제조사들이 Cortex-A15 아키텍처로 이행할 즈음하여 자체 아키텍처인 Swift를 도입한 이래, 한번도 주류 ARM Cortex 또는 퀄컴 Krait 등을 베끼지 않은 독자 설계를 고수하고 있는 관계로, 비교를 위해 애플 최후의 Cortex-A 기반 SoC인 A5/A5X를 비교 대상에 넣었습니다. "ideal perf" 로 표시된 이상적인 성능은 ARM이 직접 밝힌 (또는 Krait 아키텍처의 경우 퀄컴이 직접 기술문서로 밝힌) 아키텍처별 상대성능 자료를 사용해 제가 직접 계산한 것이고, 우측 끝의 벤치마크 수치들은 실측값들입니다. 모든 지표의 표준화(normalization)은 애플 A5를 기준으로 계산하였습니다.

 

표를 만들며 재미있는 인덱스를 하나 개발해보자 마음먹고 만든 것이 맨 오른쪽의 쓰로틀링 인덱스입니다. 그림에 설명되어 있듯 '이상적인 성능' 값으로부터 표준화된 Geekbench 멀티코어 스코어를 뺀 것으로, 아주 러프하게나마 해당 SoC가 '원래 발휘해야 했을' 성능이 발열 등의 요인으로 인해 얼마나 손해를 입었는지 알 수 있는 척도가 됩니다. 이것에 관해 짧게 이야기를 풀어 보려 합니다.

 

첫째로, 많은 분들이 가장 먼저 열심히 눈을 굴려 찾으셨을 것 같은 스냅드래곤 810의 경우 아니나다를까 가장 큰 쓰로틀링 인덱스값을 보이고 있습니다. (마이너스 50%에 달한다는 말은, 대부분의 경우 '빅' 코어의 표기상 스펙의 절반 수준의 클럭에서 작동한다는 얘깁니다.) 그러나 수치의 크고 작음의 차이일 뿐 대체로 대부분의 SoC가 쓰로틀링을 겪고 있음은 명백한데, 특히 애플을 제외한 (스냅드래곤 810도 제외한) 대부분의 SoC는 20% 안팎의 클럭 하락이 발생하는 것으로 보입니다. 가장 최신 공정 / 최신의 아키텍처를 사용한 엑시노스 7420이라고 하여 이러한 특성에서 벗어나지는 못했습니다. 반면 삼성의 몇세대 전 SoC인 엑시노스 4412의 경우 (마이너스) 10% 미만의 준수한 쓰로틀링 인덱스값을 갖는데, 이는 대부분의 해외 미디어들에서도 공통적으로 지적한 사항으로 정확히는 "갤럭시 S III 이후" 들어 SoC의 스펙 경쟁이 격화되며 자연스러운 열발산 속도 내에서 처리 가능한 수준을 넘어선 발열량을 갖는 SoC들이 우후죽순으로 쏟아져 나온 것을 반영하는 것입니다.

 

둘째로, 윗 문단에서 지적한 현대 SoC들의 비관적인 출혈 경쟁에 불구하고 간간히 양호한 인덱스를 보이는 제품들이 있었으니, (애플 제외 : 애플은 세번째 토픽으로 따로 짚을 예정입니다) 엑시노스 5260과 스냅드래곤 615/808, 대부분의 테그라 제품군이 그들입니다. 이 중 테그라는 코어 구성 자체가 그리 야심차 보이지 않는 캐주얼한 구성이고 (대신 GPU가 아주 빵빵합니다) 특히 상위급 테그라 (테그라 K1) 는 태블릿용으로 쓰여 상대적으로 열 발산 여건이 나았다는 점을 고려할 때 이 엔트리에서 제외하고 보면 남은 셋은 공통점이 있습니다. 빅/리틀 구성에 있어 "빅"이 극도로 축소되었거나, 적어도 현세대 플래그십의 절반 수준으로 제한되어 있다는 점입니다.

 

스냅드래곤 615는 삼성 갤럭시 A 시리즈에도 사용된 제품으로서, 말하자면 삼성이 '버리지 않은' 마지막 & 최신의 퀄컴 SoC라 할 수 있는데 이미 이것만으로 해당 제품의 밸런스가 괜찮음이 간접적으로 드러납니다. 특징이라면 전통적인 "빅" 코어용 아키텍처가 아닌 Cortex-A53을 빅/리틀 클러스터 양쪽에 사용했다는 점인데 그 덕분에 이론상 성능은 똑같은 8코어를 갖는 다른 플래그십 SoC의 절반 수준에도 못 미치고 있기도 합니다. 그러나 결과적으로 보면 거의 쓰로틀링을 겪지 않고 있음이 확인됩니다. (사실 저 인덱스값이 양수가 나올 수 없는 건데, 이건 이론성능 계산식상의 오차로 간주하겠습니다.) 마찬가지로 "빅" 듀얼코어 + "리틀" 쿼드코어 구성을 취한 엑시노스 5260과 스냅드래곤 808 역시 거의 제 성능을 다 발휘한다는 점이 드러납니다. 특히 스냅드래곤 808은 바로 윗 모델인 810보다 이론상 성능은 40%가까이 떨어지는 수준이나 ("빅" 두개를 쳐냈기 때문에 표면상 코어갯수인 8코어 vs 6코어 비율보다도 떨어집니다) 실측 성능은 오히려 810을 넉넉한 차이로 앞서고 있습니다. 최근 LG가 G Flex 2와 G4를 연이어 출시하며 각기 스냅드래곤 810 / 808을 적용했던 사례에 시사하는 바가 크지 않을까 생각됩니다.

 

셋째로, 다른 모든 제조사와 달리 애플의 SoC는 거의 쓰로틀링 문제가 없었다는 점입니다. 애플은 하드웨어부터 소프트웨어까지 자사 제품에 사용되는 모든 요소에 완벽을 기울여 최상의 '밸런스'를 찾는 데 거의 편집증적인 강박을 보이는 것으로 유명합니다. 심지어 '넘치는 성능' 마저 지양하는 모습마저 보여 유저들로 하여금 혀를 내두르게 할 때가 한 두 번이 아니었는데, SoC 설계 (정확히는 양산품을 두고 최종 작동속도를 정하는 단계) 에 있어서도 이러한 노력이 고스란히 반영되었다고 볼 수 있겠습니다. 바꿔 말하자면, 애플 SoC가 애플이 아닌 다른 제조사의 것이었다면 현재 출시된 작동 속도보다 20%가량 더 높은 표기상 스펙을 가질 여력이 있었음에도 애플은 굳이 클럭을 낮춰 결정했다는 점입니다.

 

마지막으로, 위 그림의 가장 아랫부분에 끼워넣은 '미출시 SoC 성능 예측' 에 관해, 제가 가정했던 요소들을 언급하는 것으로 글을 마무리하려 합니다.

 

(가칭) 엑시노스 M1은 삼성 사상 처음으로 자체 커스텀 IP인 '몽구스'를 사용할 것으로 알려졌는데 최근의 벤치마크에서 엑시노스 7420 대비 45% 더 높은 싱글코어 성능을 달성했다고 전해집니다. 이를 곧이곧대로 믿고 몽구스 4코어 + Cortex-A53 4코어가 빅/리틀로 조합된 형태를 가정했을 경우 예상되는 이상적인 성능값은 1600%p가 됩니다. 이것만으로도 놀라운 성능 향상이라 할 수 있겠습니다.

 

그러나, 여기서 감탄하기는 아직 이릅니다. 바로 'Kryo' 라는 자체 ARMv8 설계로 퀄컴이 맞불을 놓을 예정이기 때문입니다. 특히 해당 아키텍처를 적용할 첫 SoC이자 퀄컴의 야심작인 스냅드래곤 820은 빅/리틀에 대한 고려 없이 (과거 Krait 400/450을 가지고 구성했듯) "빅" 코어만으로 구성될 것이며 8코어를 탑재할 것이라고도 합니다. 역시 이 말을 곧이곧대로 믿고, 아주 보수적으로 예상하여 Kryo가 현재의 Cortex-A57 수준이라고 가정하여 계산해 보더라도 1900%p를 훌쩍 넘는 예상 성능값이 나왔습니다. 쓰로틀링을 어떻게 제어할 것인지가 퀄컴이 앞으로 밝혀야 할 어려운 숙제가 되겠지만 말입니다.

 

또한 재미있는 것으로 퀄컴 스냅드래곤 818 / 미디어텍 헬리오 X20을 들 수 있습니다. 이 둘은 모두 10코어 SoC라는 독특한 구성을 채택했는데 각각의 구성에는 다소 차이가 있습니다. 스냅드래곤 818은 빅/미디엄/리틀이 각각 4:2:4코어로 조합되는 반면 헬리오 X20은 2:4:4로 조합되어 상대적으로 후자가 다소 '약한' 구성이라 할 수 있겠으며 미디어텍 자체가 저가~중고가 스마트폰을 타겟으로 SoC를 제조하기에 어찌 보면 당연한 것이라 할 수 있겠습니다. 이것은 각 SoC가 탑재한 GPU에서도 드러나는 바, 헬리오 X20에 탑재될 4코어 말리 T880 GPU는 현 세대 기준으로도 플래그십에 입성하기엔 다소 약체에 속하기 ("말리 T880"이어서가 아니라 "4코어"밖에 안돼서) 때문입니다. 그렇더라도 예상되는 성능 자체는 의외로 양쪽이 큰 차이가 없어 스냅드래곤 818은 1280%p, 헬리오 X20은 그보다 단 50%p 낮을 뿐인 1230%p를 기록했습니다.

 

마지막으로 스냅드래곤 620/618의 경우 현 810/808의 관계와 마찬가지로 빅/리틀 중 "빅"의 코어 구성을 4코어/2코어로 변화시킨 것으로 다음 세대쯤의 중상위급 라인업에 채택될 것이 유력한 SoC들입니다. 예상되는 성능 역시 현세대 기준으로는 '준 플래그십'에 속해 차세대 중위권을 탄탄히 뒷받침해 주리라 예상됩니다.

 

이것으로 글을 마칩니다. 어쩌다보니(?) 길어진 글, 읽어 주시느라 고생하셨습니다.

이미지는 어디든 퍼 가셔도 되지만, 우측 하단의 작성자 표기는 유지해 주시기 바랍니다.

모두 좋은 밤 되세요!

 

//