본문 바로가기

Lecture & Column/ict_lec_col

AMD 본사 직원 인터뷰 : 스팀롤러와 HSA의 의의

Interviewer & Author : Daeguen Lee

Interviewee : Adam Kozak, Terry Makedon

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)

 

 

 

지난 12일엔 서울 모처에서 AMD의 APU Tech Day 행사가 열렸습니다. 이 글에서 간단히 행사장 전경을 전달해드렸었죠. 당시 AMD 아태지역 PR 총괄 홍정연 차장님의 주선으로 본사 엔지니어와의 인터뷰를 진행할 기회를 갖게 되었는데, 마침 어제부로 민감한 내용들(?)에 관한 엠바고가 해제된 관계로 당시 인터뷰 스크립트를 간단히 번역해 소개합니다. APU 시장과 HSA의 미래에 관한 AMD측의 속내를 한번 들여다봅시다.

 

인터뷰이로는 애덤 코작(Adam Kozak) 데스크탑 프로덕트 마케팅 매니저와 테리 마케돈(Terry Makedon) 카탈리스트 매니저가 자리해 주셨습니다.

 

 

Q : 앞서 진행된 카베리 런칭 프리젠테이션을 잘 보았다. 주로 그래픽 측면에서의 혁신이 언급되었는데 사실 카베리는 그래픽만 새로워진 것이 아니라 파일드라이버 이후 2년만에 AMD의 새로운 CPU 아키텍처가 쓰인 제품이기도 하다. AMD에서는 스팀롤러 아키텍처를 적용한, APU가 아닌 단독 CPU를 출시할 계획은 없나?

 

A : 우리의 FX 라인업은 그대로 파일드라이버 아키텍처를 사용할 것이다. 파일드라이버가 스팀롤러보다 작동속도가 더 빠르기 때문이다.

 

Q : 확실히 짚고 넘어가자. 앞서 발표에서 스팀롤러 아키텍처를 통해 20%의 IPC 향상을 달성했다고 했는데, 그럼에도 불구하고 상위 라인업에서 파일드라이버를 대체하지 않는다는 것은 작동속도의 감소분을 IPC의 향상으로 상쇄시킬 수 없다는 뜻인가? 가령 스팀롤러 아키텍처로 달성 가능한 최고 작동속도에서의 성능이 종합적으로 파일드라이버를 넘어서지는 못한다는 뜻으로 받아들여도 되는 것인가.

 

A : IPC 증분과 클럭 감소를 종합했을 때 현재로써 우리에게 스팀롤러로 파일드라이버를 대체하는 것이 가져다 줄 이득이 없다. 그리고 우리는 맨틀에 큰 기대를 걸고 있는데, 알다시피 맨틀은 개별 코어의 성능보다는 멀티스레딩 자체가 더 중시되므로 개별 코어의 성능을 개선하는 방향으로는 그리 크게 고려하지 않고 있다.

 

Q : 카베리의 내장 GPU가 최대 8개의 컴퓨트 유닛을 갖는다는 것 외에 그 제원에 관해 알려진 정보가 거의 없다. TMU나 ROP의 갯수를 알려줄 수 있나.

 

A : 각 컴퓨트 유닛당 64개의 스트림프로세서, 4개의 TMU가 있으며 렌더 백엔드는 2개가 탑재된다. (※ 렌더 백엔드당 4개의 ROP가 탑재되므로 SP:TMU:ROP 구성비는 512:32:8이 된다)

 

Q : AMD가 생산 중인 플레이스테이션 4나 엑스박스 원의 SoC는 수율 문제로 모든 다이를 활성화하지 못하고, 일부분이 비활성화된 채 선적되고 있다. 작년까지만 하더라도 카베리가 12 혹은 14 컴퓨트 유닛을 탑재한다는 설이 있었는데, 그렇다면 콘솔 SoC의 예와 마찬가지로 오늘 발표한 사양이 카베리의 풀스펙이 아닌 것은 아닌가?

 

A : 언급된 것들과 달리 카베리는 그렇지 않다. 또한 현재 탑재한 것 이상을 탑재하면 칩이 커지게 되어 단가가 상승하게 된다.

 

 

Q : 앞서 스팀롤러 기반 FX를 출시할 계획은 없다고 했는데, 서버 시장에서는 어떠한가. 스팀롤러 단독 CPU, 혹은 카베리처럼 APU의 형태로 계획 중인 서버 제품군이 있는가?

 

A : APU 기반의 옵테론은 고려 중이다. 단독 CPU로서는 계획이 없다.

 

Q : 카베리와 듀얼그래픽 구성이 가능한 라데온 SKU는 어떤 것이 있는가? 앞서 발표에서 라데온 R7 시리즈와 듀얼그래픽 구성을 할 수 있다고 뭉뚱그려 언급되었는데 R7 시리즈를 구성하는 GPU의 종류만도 3종에 달한다. 정확히 어떤 SKU와 조합이 가능한지 알려달라.

 

A : Oland GPU를 사용하는 R7 240/250과 듀얼그래픽 구성이 가능하다.

 

Q : 인텔의 임베디드/모바일 프로세서에 번들되는 아이리스 그래픽과 비교했을 때 카베리의 내장그래픽 성능은 어떠한가?

 

A : 아이리스 그래픽이 내장되는 인텔 제품군의 가격대를 고려할 때 카베리와 비교 자체가 적절하지 않다. 또한 알다시피 인텔의 그래픽 드라이버 지원은 좋지 않다.

 

Q : 확실히 짚고 넘어가자. 가격 등 다른 모든 요소를 배제하고, 아이리스 그래픽과 카베리의 내장그래픽 중 어떤 것이 더 빠른가?

 

A : 아이리스를 가지고 있는가? ("맥북 프로를 갖고 있다.") 잘 모르겠다. 테스트하게 되면 우리에게도 결과를 알려 달라. 둘의 가격과 함께. (※ 주 : 공식적인 답변은 이와 같았으나 구체적인 답변을 우회하려는 느낌을 받았다. 개인적으로는 가성비 논리가 방어논리로써 등장한 점에서 역설적으로 아이리스가 카베리를 앞서는 부분이 있단 점을 시인했단 생각이다.)

 

Q : HSA의 기본 개념은 매력적이나 당장 활용 가능한 영역을 잘 모르겠다. HSA를 통해 향상된 성능을 활용할 수 있는 프로그램이나, 측정할 수 있는 벤치마크 툴이 존재하는가?

 

A : Libre Office, Aftershot Pro, x264 인코더, JPEG 디코더 등 사용 가능한 프로그램이 목록화되어 있다.

 

Q : 슈퍼파이는 AMD가 굉장히 열세인 벤치마크 툴 중 하나이다. HSA가 지향하는 궁극적인 목표는 CPU와 GPU가 x87 등 범용 라이브러리를 협력해 처리하는 것이라고 생각한다. 옳게 가정한 것인지, 만약 그렇다면 언제쯤 그러한 것이 가능해질지 궁금하다.

 

A : 내부적으로 GPU를 통해 슈퍼파이를 구동하는 것과 같은 일들을 진행해 왔다. 실행 가능한 코드는 이미 있고, 기존의 CPU와는 비교할 수 없이 빨라진다.

 

 

인터뷰를 통해 어렴풋하게나마 AMD가 그리는 HSA의 이상향이 무엇인지, 궁극적으로 APU가 지향하는 지점이 어디인지에 대해 감을 잡아볼 수 있었습니다. 그 첫 단추를 끼우기 위해 투입된 카베리. 시장이 과연 카베리에 어떻게 반응할지 궁금해지는 순간입니다. 앞으로 AMD가 이루고자 하는 일들이 어떻게 풀려갈지, 지켜보도록 하겠습니다.

 

이상으로 인터뷰를 마칩니다. 읽어 주셔서 감사합니다.