Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)

 



Introduction


2008년, AMD는 'Star'로 명명된 K10 아키텍처 기반 프로세서를 선보이는 것과 동시에 기존의 하이엔드급 제품군에 붙이던 브랜드인 Athlon을 밸류급으로 격하, 기존의 Athlon이 담당하던 브랜드명을 Phenom이란 새 이름으로 전격적으로 교체한 바 있습니다. 이와 동시에 (대개 4코어급으로 출시된) K10 기반 Phenom 제품군과 (최대 2코어까지인) 기존 K8 기반 Athlon 제품군이 공존하는 체제가 구축되어 현재까지의 AMD의 라인업의 근간을 이루고 있습니다. 기존의 K8 아키텍처에 기반한 Athlon과 K10 기반의 Phenom의 차이점을 꼽자면, 크게 아래의 세 가지를 들 수 있습니다.


- 메모리 듀얼채널 모드 세분화: Ganged 모드, Unganged 모드
- CPU와 같은 다이 내에 내장되는 레벨-3 캐시 (L3 캐시) 신설, 단 온다이 캐시임에도 작동속도는 같지 않음
- 내장 메모리 컨트롤러(IMC)와 CPU 코어의 작동속도의 비동기화 : IMC는 L3 캐시와 동기화


앞의 두가지가 성능향상을 위한 변화라면 마지막 변화인 IMC와 코어클럭의 비동기화(과거엔 IMC와 코어클럭이 같았기에, 이는 IMC의 저속화를 의미합니다)는 명백히 성능을 끌어내리는 요인이 됩니다. 펜티엄 III 시절 Katmai와 Coopermine 사이의 관계라든지, 초기 Athlon K7과 Thunderbird의 관계 등 캐시의 작동속도가 때로는 용량 차이를 뛰어넘어 성능을 좌우했던 선례를 보아도 그렇습니다.


당시 AMD가 내놓은 최상급 CPU인 Phenom X4 프로세서가 2.6GHz까지 속도를 높여 출시되는 동안 IMC/L3 캐시를 뭉뚱그려 부르는 이름인 'NB'의 속도는 1.8GHz에 묶여 있었고, 이로 인해 NB클럭과 코어클럭이 동기화되어 있던 기존 K8 계열 프로세서들보다 몇몇 벤치마크에서의 성능은 오히려 뒤처지는 모습을 보여주기도 했습니다. 이는 이후 출시된 45nm 공정의 Phenom II(현재 3.4GHz까지 출시됨)에도 마찬가지로 나타나는 현상으로, 코어클럭이 가파르게 상승하는 동안 NB클럭은 여전히 1.8GHz(DDR3 메모리를 지원하는 모델은 2GHz)에 묶여 있어 코어클럭과 NB클럭 사이의 갭은 점점 더 늘어나는 상황입니다.

이 벤치에서는 Phenom II X4 프로세서의 NB 오버클럭을 통한 성능 변화를 알아보도록 하겠습니다.


Test Setup & Methodology


테스트에 사용된 시스템의 사양은 아래와 같습니다.

CPU: AMD Phenom II X4 'Deneb' 940 Black Edition
CPU쿨러: Zalman CNPS9900NT + ZM-STG2 써멀그리스
M/B: ASUS M4A79 Deluxe (BIOS ver.2009.8.1)
RAM: Crucial Ballistix DDR2-SDRAM PC2-8500 1GB x 4EA @ 1066MHz / 5-5-5-15
VGA: ASUS EN9800GTX (nVIDIA ForceWare ver.190.38)
HDD: Western Digital 300GB VelociRaptor WD3000HLFS
PSU: Skydigital PowerStation2 650AF 80PLUS
O/S: Microsoft Windows 7 Ultimate RC2 (Build 7100)


하드디스크에는 일상적인 프로그램들이 설치되어 있는 상태이며 (즉 Clean 상태가 아님)
3DMark 06을 돌리기 전 로드되어 있는 프로그램은 매 경우 아래의 둘로 동일합니다.


- AVG Free 8.5
- CPU-Z

NB클럭의 향상이 얼마나 3DMark 06의 점수향상에 도움이 되는지 비교하기 위해 CPU클럭은 3GHz에서 3.8GHz까지, NB클럭은 2GHz에서 2.8GHz까지 변화시켜 가며 각 CPU클럭 & NB클럭의 조합마다 3DMark 06을 세 번씩 돌려 평균값을 취했습니다.


Result


가. CPU클럭 3.0GHz에서의 NB클럭별 성능 비교

<3DMark 06 Total Score 평균>


<3DMark 06 CPU Score 평균>


아래 '더보기'에는 위의 그래프를 얻기 위한 raw data가 있습니다.

더보기


나. CPU클럭 3.2GHz에서의 NB클럭별 성능 비교

<3DMark 06 Total Score 평균>


<3DMark 06 CPU Score 평균>

더보기

다. CPU클럭 3.4GHz에서의 NB클럭별 성능 비교

<3DMark 06 Total Score 평균>


<3DMark 06 CPU Score 평균>

더보기

라. CPU클럭 3.6GHz에서의 NB클럭별 성능 비교

<3DMark 06 Total Score 평균>


<3DMark 06 CPU Score 평균>

더보기

마. CPU클럭 3.8GHz에서의 NB클럭별 성능 비교

<3DMark 06 Total Score 평균>


<3DMark 06 CPU Score 평균>

더보기

바. 가~마 결과값 종합 비교

<3DMark 06 Total Score 평균 - sorted by CPU>


<3DMark 06 Total Score 평균 - sorted by NB>


<3DMark 06 CPU Score 평균 - sorted by CPU>


<3DMark 06 CPU Score 평균 - sorted by NB>

더보기



Conclusion


(1) '바' 의 결과값 비교그래프를 보면 CPU클럭 3.0~3.4GHz 구간에서는 선형적인 성능향상이 있으나 그 이상에서는 Total Score의 경우 성능향상의 체감현상 (Marginal decreasing) 이 발생함을 알 수 있습니다. (VGA의 성능의 한계인듯 합니다.)

(2) 다만 CPU클럭을 막론하고, NB클럭의 향상은 각 구간별로 비교적 선형적인 성능향상을 가져다 줍니다 (Total Score 기준). NB클럭의 설정범위인 2.0~2.8GHz를 넘어 3GHz 이상으로 오버클럭이 가능하다면 CPU클럭 200MHz의 갭을 따라잡을 수도 있을것 같습니다만 현실적으로 2.8GHz 이상으로의 NB 오버클럭은 극히 어렵습니다.

(3) CPU Score를 보면 Total Score와 달리 CPU클럭 3.6GHz 이상에서도 체감현상이 발생하지 않고 선형적인 성능향상을 보여줍니다. 이 벤치에 사용된 VGA가 GeForce 9800GTX 로 중상위급 모델임을 감안할 때, 더 고성능의 VGA를 사용한다면 Total Score에서도 체감현상이 발생하는 시점이 더 늦춰질 것 같습니다. 또한, 그 경우 NB클럭 상승에 따른 성능향상폭 또한 지금보다 더 클 것으로 예상됩니다.

(4) NB클럭은 대대익선이지만, 오버클럭 안정화에 필요한 전압 및 발열 등을 감안하여 가장 이상적인 '국민오버' 세팅은 대략 2.4~2.6GHz 이내라는 결론입니다.

(5) 현재 팔리고 있는 인텔 CPU들과 비교시 IPC가 얼마나 달라지는지 비교해 보았습니다.
(켄츠필드 / 요크필드는 Tom's Hardware Guide CPU벤치 http://www.tomshardware.com/charts/cpu-charts-2008-q1-2008/3DMark06-CPU,370.html 에서 인용했고, 블룸필드 / 린필드 벤치는 앞의 출처에서 3DMark 06으로 한 결과가 없는 관계로 Brainbox CPU성능표에서 인용했습니다.)


보시다시피 데네브는 NB클럭이 디폴트일 때에는 동클럭의 켄츠필드보다 약간 낮은 성능을 보입니다.
3GHz인 켄츠필드 QX6850과 2.93GHz인 QX6800의 사이에 데네브 940BE 디폴트가 위치합니다.
하지만 NB클럭을 2.8GHz로 오버하자 동클럭의 켄츠필드를 넘어 요크필드를 상회하는 성능을 보입니다.
요크필드의 오버클럭 마진이 더 높기 때문에 극한으로 오버한다면 요크필드가 더 낫겠지만
3.6~3.8GHz 로 둘 다 실사용이 가능하단 점으로 볼때 NB오버의 효용가치는 꽤 높은 것 같습니다.
네할렘들은 역시 넘사벽이군요. (2.67GHz인 920을 데네브 3.4GHz/NB 2.8GHz 에서 겨우 제쳤습니다)

아래는 동클럭 켄츠/요크와의 비교를 좀더 세분화해 보았습니다.


빨간색으로 표시한 구간 (2.4GHz - 2.6GHz) 사이에 동클럭의 요크필드를 넘어서는 지점이 존재합니다.


6. More on this topic...

(1) NB클럭은 L3캐시의 속도 및 내장메모리컨트롤러의 속도입니다. 메모리컨트롤러의 속도향상이 성능향상을 가져다 준다면, 정작 메모리의 속도에 따른 성능변화는 어떨까요? 조만간 동일한 CPU클럭-NB클럭 하에서 메모리 속도를 변화시켜 가며 벤치마크를 해 볼 예정입니다.

(2) AMD 플랫폼의 통로 격인 하이퍼트랜스포트 링크 (HT Link) 클럭에 따른 성능변화는 어떨까요? 전통적으로 3DMark는 시스템버스의 속도에 민감한 성능 차이를 보여왔단 점으로 미뤄 보아 HT Link 클럭별 성능변화도 흥미로울 것 같습니다.



긴 벤치를 끝까지 읽어 주셔서 감사합니다. ^_^
신고