본문 바로가기

Lecture & Column/vga_lec_col

AMD의 또다른 수 : 버뮤다, 피지 - 두개의 빅 칩?

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy or the original source is strictly prohibited)

 

 

 

(※ 이 글은 http://iyd.kr/706 글 후단의 외전격으로 쓰여졌습니다.)

 

AMD가 ATI를 인수한 2006년. AMD의 인수 일성은 "스윗 스팟을 공략하겠다" 는 것으로 요약된다. 인수 직전까지 ATI가 출시했던 최상위 제품인 라데온 HD 2900 XT는 R200 GPU를 탑재하고 있었는데 이 칩의 면적은 420mm2(제곱밀리미터)에 달했다. 이 기록은 제작년 연말 AMD가 하와이를 출시하며 비로소 갱신되었고(하와이는 438mm2) 하와이의 출시 자체가 '스윗 스팟' 과는 맞지 않는 초강수로 이례적이란 평을 받았으니 당시 R600의 면적은 엄청나게 거대한 것이었다. 즉 9년 전 스윗 스팟 중시로 돌아선 AMD의 노선 변경은 자발적인 최고위시장 포기라기보다도 비정상적으로 폭주하고 있던 ATI를 정상화시키기 위한 단기간의 대증처방에 더 가까운 것이었으리라. 실제로 AMD는 그 뒤 하와이에 이르기까지 전 라인업이 400mm2를 초과하지 않게 엄격히 억제해 왔으며, 그럼에도 경쟁사와의 맞대결에 비교적 대등하게 임할 수 있었다.

 

이런 역사적 배경 앞에서, 최근 돌고 있는 AMD의 차세대 GPU 관련 루머는 도저히 믿기 힘든 것이라고밖에 할 수 없다. 제조공정을 28nm로 유지하며 하와이보다 더 고사양의 칩(피지)을 만든다는것 자체도 상식 밖의 일인데 근래에는 심지어 하와이보다 상위 라인업을 구성하는 칩이 한 가지가 아니라는("버뮤다-피지 설") 정보까지 유통되고 있는 실정이다. 이를 액면 그대로 수용다면 AMD는 역사상 처음으로 자사의 칩 포트폴리오에 복수의 '400 제곱밀리미터를 초과하는 칩' 을 끼워넣게 되는 것인데, 이 버뮤다-피지 설을 조금이나마 믿을만하게 만들어줄 단 하나의 조건이 있다면 20nm 공정의 도입뿐이라 하겠다.

 

그러나 20nm로의 공정변환을 전제하더라도 여전히 의문점이 남아 있다. 최상위 칩 하나뿐만이 아니라 둘 모두 하와이보다 높은 스펙으로 무장하는 게 가능한 일인가. 다시 말해 AMD가 그간 세대를 교체해 오면서 최상위 아닌 차상위 칩에 전세대 최상위 칩보다 더 많은 트랜지스터를 우겨넣을 정도로 공격적인 자세를 취한 적이 있던가. 이것이 내 궁금증이었고 이를 해결하기 위해 간단히 찾아본 것이 아래의 계보들. AMD의 ATI 인수 후 내놓은 모든 최상위-차상위 GPU를 조사한 것이다.

 

 

조사 결과는 예상 밖이었다. 칩 사이즈는 둘째치더라도 트랜지스터 수만큼은 충분히 공격적으로 늘려 왔다는 분석이 가능할 것이다. 라데온 HD 3000 시리즈에서 4000 시리즈로의 이전을 보면 최상위 라인업인 HD 4800 시리즈에 9억 5600만개의 트랜지스터를 집적했을 뿐만 아니라 (HD 4800과 동시 출격으로 보기엔 무리가 있으나) HD 4700 시리즈의 RV740 칩에도 전세대 최상위 칩인 RV670의 6억 6600만개를 훌쩍 뛰어넘는 8억 2600만개의 트랜지스터를 넣어 두고 있다. 5800 / 5700의 예를 보더라도 5700 시리즈에 쓰인 주니퍼는 RV770보다 많은 트랜지스터를 내장하고 있고, 7000 시리즈에서 차상위 라인업을 담당하는 7800 역시 전세대 6900 시리즈에 쓰였던 케이맨보다 더 많은 트랜지스터를 탑재하고 있다(26억 -> 28억). 심지어 가장 최근 출시된(하와이의 하위 라인업을 담당하는) 통가 역시 타히티보다 크고 & 트랜지스터 수가 많다(352mm2 -> 359mm2, 43억 -> 50억).

 

이 규칙에 부합하지 않았던 경우는 라데온 HD 5000 시리즈에서 6000 시리즈로 넘어가던 때뿐이었는데, 이때는 라데온 HD 2000 시리즈로부터 이어내려오던 -유서깊은- VLIW5 아키텍처에서 VLIW4로 교체가 이뤄지던 과도기적 상황이었음을 감안해야 할 것이다. 그 외 모든 세대교체에서 기반이 되는 아키텍처는 이 시기 이전까지는 모두 VLIW5 내에서의 마이너 업데이트였고, 이 시기 이후는 GCN이라는 큰 틀을 공유하고 있기에 결국 큰 틀에서 항상 이 규칙이 유지되어 왔다고 보는 편이 정확할 것이다. 그렇다면 '하와이보다도 큰 스케일의 칩' 둘의 사양이 어떻게 구성될 것인지가 의문으로 남는다. 이 역시 위의 규칙이 준수된 전례들의 변화 비율을 살펴봄으로써 유추해 볼 수 있을 것 같다. RV670 -> RV770/RV740의 경우 연산유닛 수는 320개에서 800/640개로 폭증했던 바 있다. 반면 RV770 -> 사이프러스/주니퍼의 경우는 800 -> 1600/800으로 상대적으로 온건한(?) 변화가 이뤄졌고, 이는 타히티 -> 하와이/통가의 변화율와 비슷하다(2048 -> 2816/2048). 어떤 변수가 돌출될지 알 수 없으나 이 두 전례의 범위 안에서 두 차세대 칩의 사양이 결정될 가능성이 높아 보인다.

 

이상의 정보를 바탕으로, 범람하는 소문 중 골라잡은 두 칩의 사양은 아래 열거된 것 중 XT 접미사가 붙은 것이다. PRO 접미사가 붙은 것은 각 XT를 바탕으로 임의로 다운스펙한 것이다.

 

Bermuda XT : 74CU (4736ALU, 296TMU) / 96ROP / 1024bit GDDR5 HBM
Bermuda PRO : 70CU (4480ALU, 280TMU) / 80ROP / 1024bit GDDR5 HBM
Fiji XT : 60CU (3840ALU, 240TMU) / 64ROP / 1024bit GDDR5 HBM
Fiji PRO : 56CU (3584ALU, 224TMU) / 64ROP / 768bit GDDR5 HBM

 

앞의 글 (주 : http://iyd.kr/706) 후단에서 가정된 Fiji XT과 비교했을 때 Bermuda XT는 16% 가량, 여기서의 Fiji XT는 6% 가량 작아진 것이라고 볼 수 있다. 아래 그래프는 위 사양을 VGA 계산기에 대입해 얻어 본 성능 추정치를 나타내 본 것이다. (아래의 GM200은 앞의 글에서 1 SM = 128 ALU 시나리오로 가정된 것이다.)

 

 

여러분의 생각은 어떠한가. 앞의 글에서 GM200 1 SM = 128 ALU 시나리오 하에서 Fiji XT가 'GTX TITAN X' 와 맞대결이 불가능했던 것을 생각해 볼 때 확실히 AMD로서는 경쟁력있는 경우의 수라 할 수 있다. 몇달 후 드러날 AMD의 빅 칩이 과연 몇 개일지를 점쳐 보는 것 또한, AMD의 차세대 플래그십이 엔비디아의 그것과 어떤 싸움을 펼칠지 예상해 보는것만큼이나 흥미진진한 일일 것이다.

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)