글쓴이: 이대근 (ㄷㄱ)
원문: http://udteam.tistory.com/462

※ 무단전재 및 재배포를 금지합니다. 퍼가실 때에는 원제, 작성자, 출처를 반드시 병기해 주시기 바랍니다 ※


1. Introduction



안녕하세요. 오랜 공백기를 깨고(?) 새 글을 올리게 되어 매우 설레는군요.
이 글이 지금까지 제가 작성하고 올렸던 그 어떤 리뷰/벤치보다도 방대한, 알찬 벤치가 될 것이라 자부합니다.

이 글의 주제는 오랫동안 머릿속으로 구상해 온 내용이기도 하지만
또 그만큼 (물리적, 시간적으로) 실현이 어려워 오랫동안 머리 속에서만 썩혀 왔던 것이기도 합니다.

...바로 "CrossFireX vs SLI" 란 주제인데요...

그간 정말 많은 분들이 이 주제로 물음표를 키워 왔는데도 불구하고
지금까지 국내에선 3-way 이상의 크로스파이어/SLI 구성을 다룬 벤치 자체가 드물었고,
따라서 3-way 이상의 크파/SLI 유저들은 사용 중 뭔가 석연찮거나 성능이 시원찮은 느낌을 받더라도
원래 그런건지, 뭔가 잘못된건지, 잘못됐다면 어디가 잘못된건지 알 길이 없어 속을 썩여야만 했습니다.
설상가상, 이러한 구성에 관한 대부분의 참고 자료들을 해외에서 찾아야만 한다는 것도 어려움 중 하나였죠.

...이제 그동안의 설움은 끝났습니다.
여러분이 겪어 오셨던 그 모든 어려움을 한 큐에 날려 드리기 위해 제 모든 에너지를 쏟아 부었습니다!!!
기대하셔도 좋습니다!!!! msn013.gif

그럼 우선 테스트에 사용된 시스템 소개부터 들어갑니다~


2. Test Setup


테스트에 사용된 시스템은 아래와 같습니다.


(1) 하드웨어 공통

CPU: Intel Core i5 (코어i5-2세대) 2500K @ 4.5GHz (100 x 45)
Cooler: 3Rsystem ICEAGE 120mm PRIMA BOSS 2
Mainboard: ASUS MAXIMUS IV EXTREME
Memory: Samsung DDR3 PC3-10600 4GB x 2 @ 1.86GHz, CL9-10-10 1T
Storage: Intel 510 Series SSD 120GB
Power: SuperFlower SF-1300P14XE GOLDEN GREEN CRYSTAL


(2) 테스트 대조군

<CrossFireX>
Single: AMD Radeon HD 6970 2GB
Dual: AMD Radeon HD 6990 4GB*
Triple: AMD Radeon HD 6990 4GB* + HD 6970 2GB
Quad: AMD Radeon HD 6990 4GB* + HD 6990 4GB*

*: 6990 @ 880/1375
6990은 6970과 동일한 풀 스펙의 Caymen XT GPU를 두개 탑재하고 있으며 (1536SP / 96TMU / 32ROP)
GPU당 256bit GDDR5 2GB 메모리를 탑재하였으나 작동 클럭이 6970의 880/1375보다 낮은 830/1250 입니다.
이 테스트에서는 6970 x 2 구성을 모사(貌寫)하기 위해 6990을 6970 클럭(880/1375)으로 높여 사용했습니다.
물론 클럭이 같을지라도 내부/외부 크파 사이의 효율이 완전히 같지는 않으므로 차이가 있을 수 있습니다.
거기에 관해서는 이 글(6990 vs 6970 CF)을 참조하시기 바랍니다 ->
http://udteam.tistory.com/373

<GTX 580 SLI>
Single: NVIDIA GeForce GTX 580 1.5GB
Dual: NVIDIA GeForce GTX 580 1.5GB + GTX 580 1.5GB
Triple: NVIDIA GeForce GTX 580 1.5GB + GTX 580 1.5GB + GTX 580 1.5GB

<GTX 590 SLI>
Single: NVIDIA GeForce GTX 580 1.5GB**
Dual: NVIDIA GeForce GTX 590 3GB
Quad: NVIDIA GeForce GTX 590 3GB + GTX 590 3GB

**: GTX 580 @ 607/854
SLI 테스트에는 현존하는 지포스 라인업 중 두개(GTX 580 / 590)를 사용했습니다.
이 둘을 선택한 이유는 첫째로 (보편적으로 알려진) 크파 효율이 '높다'는 사실이, 단지 라데온의 단일 GPU의
성능이 낮기 때문에 CPU의 병목에 도달하기까지의 여유가 많기 때문일 뿐인지를 검증하기 위해서이고,
(즉 단일 GPU로써의 성능이 6970보다 낮은 590의 SLI 효율을 크파 효율과 대조해 봄으로써
실질적으로 크파나 SLI 둘 중 어느 쪽이 확연히 우월한지를 검증하기 위함입니다)
현실적으로, 샌디브릿지 지원 메인보드 중 GTX 580을 4-way로 구성할 수 있는 모델이 없기 때문에
물리적인 카드 갯수를 3개 이하로 한정한 상황에서 NVIDIA쪽의 4-way 대조군을 만들기 위해서이기도 합니다.

그러려면 우선 590의 내부 SLI 효율을 알기 위해 590의 단일 GPU로써의 성능을 측정할 필요가 있었고,
이를 위해 580을 590의 기본클럭인 607/854로 낮추어 테스트한 결과를 포함하게 되었습니다.
590과 580은 같은 GF110 GPU (512SP / 64TMU / 48ROP) 를 탑재하고 있으며, 클럭만 590이 더 낮습니다.


(3) 소프트웨어

Microsoft Windows 7 Enterprise 64bit + Service Pack 1
AMD Catalyst 11.10 WHQL + 11.9 Catalyst Applications Profile (CAP) 4*
NVIDIA GeForce R285 Driver 285.62 WHQL
MSI Afterburner 2.2.0 Beta 8
Fraps 3.4.7

*Battlefield 3에서는 드라이버 버전별 비교를 위해 Catalyst 11.9 WHQL + 11.9 CAP 4도 함께 사용했습니다.


(4) 테스트 시스템 사진들

<CrossFireX - Single (6970 단일)>


<CrossFireX - Dual (6990 단일)>


<CrossFireX - Triple (6990 + 6970)>


<CrossFireX - Quad (6990 x 2)>


<SLI - Single (GTX 580 단일)>


<SLI - Dual (GTX 580 x 2)>


<SLI - Triple (GTX 580 x 3)>


<SLI - Dual (GTX 590 단일)>


<SLI - Quad (GTX 590 x 2)>



(5) 테스트 게임

Aliens vs Predator, Benchmark Tool
Battlefield: Bad Company 2, 첫번째 미션 3번째~4번째 체크포인트 사이 직선 진행 구간 (차량 추격씬)
Battlefield 3, 첫번째 미션 4번째~5번째 체크포인트 사이 주차장 교전 구간
Crysis: Warhead, Benchmark Tool, Avalanche 맵
Crysis 2, Benchmark Tool, Downtown 맵
H.A.W.X 2, Benchmark Tool
Lost Planet 2, Benchmark Tool, Test Type B
Metro 2033, Benchmark Tool
Resident Evil 5, Benchmark Tool, Fixed Test
S.T.A.L.K.E.R: Call of Pripyat, Benchmark Tool, Sun Shafts

모든 게임은 게임 내에서 or 벤치마크 툴에서 설정 가능한 최상위 옵션으로 둔 상태로 테스트를 진행했습니다.
단, 예외적으로 Metro 2033의 Advanced PhysX 옵션은 꺼 두었는데,
이는 VGA의 성능 한계를 보기 전에 CPU에 의한 병목현상이 일어나는 것을 방지하기 위해서입니다.

그럼, 이제부터 테스트 결과를 보여 드리도록 하겠습니다. (오래 기다리셨죠?)
첫번째 주자는 Aliens vs Predator 입니다.


3. Aliens vs Predator


우선 안티알리아싱 미적용시의 결과부터 살펴보도록 하겠습니다.


▲ 이 게임에서의 크파 효율은 더이상 좋을 수 없을 만큼 좋아 보입니다.
심지어, 물론 오차 범위이겠지만 2-way 크파 구성은 싱글의 두 배가 넘는 성능을 보이기까지 합니다.
그렇다면 SLI는 어떨까요?


▲ 580에서의 SLI 효율도 상당히 좋아 보입니다.
일단 2-way SLI 구성시의 성능은 싱글의 두 배에 육박하는 수준이고 3-way 구성시의 성능도 싱글의 (정확히 세 배는 안 되지만) 세 배에 육박하고 있는 것을 보실 수 있습니다.
하지만 앞서 본 크파 그래프와 비교해 보면, 580의 싱글 성능이 6970보다 앞섬에도 불구하고 트리플에 이르러서는 성능이 따라잡힌다는 점에서 SLI보다는 크파 효율이 더 좋다는 것을 알 수 있습니다.

그렇다면 이러한 효율 차이가 크파/SLI의 본질적인 차이에 기인하는지,
아니면 단지 6970의 싱글 성능이 580보다 더 낮기 때문에 VGA 외적인 요소 (= 주로 CPU) 에 의한 병목현상이 발생하는 시점이 오기까지 더 여유가 있었던 것일 뿐인지 알아봐야겠죠.

아래 그래프는 590 SLI 테스트 결과입니다. 이를 통해 크파/SLI의 효율 차이를 검증해 보도록 합시다.


▲ 590 클럭으로 다운클럭된 580과 590 단일을 비교해 보면 거의 정확히 두 배의 차이가 남을 알 수 있습니다.
다만 590 x 2의 4-way SLI 효율만큼은 앞서 살펴보았던 4-way 크파보다 효율이 낮은 것이 확실해 보입니다.

어쨌든, 2-way 구성시의 효율만큼은 어느 쪽이든 200%에 가깝기에 우열을 가리는 게 꽤 어려울듯 합니다.
지금까지의 결과를 한 장의 그래프로 정리해 보았습니다.


▲ 절대 성능 면에서, 싱글 GPU의 성능은 590 반쪽 (580 @ 590 클럭) < 6970 < 580의 순으로 나타납니다.
580의 이러한 우세는 2-way까지 이어지지만, 여기서 라데온 2-way와의 격차는 오히려 줄었단 점에 주목하시기 바랍니다.
또한 라데온은 2-way를 넘어 3-way / 4-way까지 거의 효율 저하 없이 쭉쭉 프레임이 올라가고 있지만 580은 3-way 구성에서 6970 3-way에 성능이 역전당한 데 이어, 590 두장의 4-way SLI 효율도 그리 좋아 보이지는 않습니다.
한편 590 x 2 (4-way SLI) 의 성능은 580 x 3 (3-way SLI) 와 거의 비슷하게 나타납니다.

이번에는 크파/SLI의 순수한 효율만을 한 장의 그래프로 나타내 보겠습니다.


▲ 일단 2-way 성능은 각 대조군별로 최저 189%, 최대 206%까지로
산술적으로 따져보면 차이가 없다고는 할 수 없으나, 200%가 넘는 효율은 오차일 것이 확실하며, 이를 감안할 경우 어느 쪽이든 싱글 대비 1.9배~2배 가량의 성능이 되기에 2-way 구성시의 효율은 크파/SLI를 막론하고 매우 좋은 편이라고 볼 수 있습니다.
그렇지만 3-way 구성부터는 6970/6990이 295%로 거의 싱글 성능의 3배에 근접한 효율을 보이는 데 비해 580의 3-way SLI 효율은 263%로, 마지막으로 추가된 한 장의 카드는 원래의 70% 정도의 성능밖에 더하질 못하고 있습니다.
마찬가지로, 4-way 구성에서의 효율 역시 6990 x 2가 590 x 2를 20% 가량 앞서는 것을 알 수 있습니다.

일단 여기까지의 내용을 바탕으로 Aliens vs Predator / No AA 모드의 결과를 요약하면 아래와 같습니다.

- 대조군 중 최고 성능: 6990 x 2 (4-way CrossFireX) 구성
- GTX 580 vs 6970 동일 조건 비교시 최고 성능: 6990 + 6970 (3-way CrossFireX) 구성
- CrossFireX vs SLI 효율 비교: CrossFireX 승


지금부터는 여기에 4배율 안티알리아싱을 걸고 테스트했을 때의 결과를 보여 드리도록 하겠습니다.


▲ 여기에서도 라데온의 크파 효율은 매우 좋습니다. 그렇다면 580 SLI는 어떨까요?


▲ 580 SLI 효율도 좋은 편이지만 똑같은 패턴 (싱글 / 2-way에서 앞서다 3-way에서 역전패) 이 반복됩니다.
그렇다면 단일 GPU로써의 성능이 6970/580보다 떨어지는 590의 SLI 효율은 과연 어떨까요?


▲ 2-way만을 보면 590의 SLI 효율은 대단히 좋은 편이지만, 4-way 효율은 여전히 크파에 밀리고 있습니다.
지금까지의 결과를 보기 쉽게 하나의 그래프로 정리해 보겠습니다.


▲ 580과 6970의 관계는 "싱글: 580의 우세 -> 2-way: 타이 -> 3-way: 6970의 역전" 으로 요약 가능합니다.
또한 580과 590의 비교에서, 580 x 3 구성과 590 x 2 의 성능이 큰 차이 없이 비슷한 결과를 보이고 있습니다.
안티 적용시의 크파/SLI의 효율을 한 장의 그래프로 나타내 보면 아래와 같습니다.


▲ 이것 역시 안티 미적용시와 비슷한 결과입니다.
2-way 효율은 대조군을 막론하고 매우 좋은 편이지만, 3-way부터는 크파 구성이 확연한 우위를 보입니다.

여기까지의 내용을 바탕으로, Aliens vs Predator / 4x AA 모드의 결과를 요약하면 아래와 같습니다.

- 대조군 중 최고 성능: 6990 x 2 (4-way CrossFireX) 구성
- GTX 580 vs 6970 동일 조건 비교시 최고 성능: 6990 + 6970 (3-way CrossFireX) 구성
- CrossFireX vs SLI 효율 비교: CrossFireX 승



4. Battlefield: Bad Company 2


우선 안티알리아싱 미적용시의 결과부터 보여 드리도록 하겠습니다.
(풀옵인 "High" 옵션 설정시 기본으로 2x MSAA가 적용되는데, High 옵션에서 안티만을 해제한 설정입니다)
이 장의 결과값은 벤치마크 툴이 아닌 실제 플레이시의 프레임을 Fraps를 통해 측정한 값이며,
결과의 신뢰성을 위해 동일한 구간에 대해 3회 반복 측정 후 중간값을 취했습니다.


▲ Aliens vs Predator의 자로 잰 듯 선형적인 그래프를 기억하신다면 약간 실망스러우실 수도 있겠습니다.
이 게임을 플레이하는 동안 프레임을 관찰하다 200프레임 상한선이 존재한다는 것을 알아 차렸는데,
이 상한선을 해제하거나 더 높이는 방법을 찾기 위해 해외 포럼을 이 잡듯 뒤졌지만... 결국 찾지 못했습니다.

이런 내재적인 한계로 인해 그래픽 성능이 높아질수록 프레임은 200 근처로 수렴하게 될 수밖에 없습니다.
또한 그 결과로 크파/SLI 효율 역시 카드가 한장씩 추가될 때마다 급격히 나빠지는데,
이런 양상이라면 단일 GPU의 성능이 고성능일수록 크파/SLI의 효율은 떨어질 수밖에 없을 것입니다.
즉 이 점을 미리 숙지해 두고, 아래의 580 SLI 결과를 보도록 합시다.


▲ 580도 6970/6990과 마찬가지로 카드가 한 장씩 추가될 때마다 성능 향상폭은 점차 감소하고 있습니다.
또한 절대 성능에서 2-way 까지는 6970/6990을 앞서던 580이 3-way에선 또다시 역전패를 당했습니다.
즉 고성능 단일 GPU라는 효율상의 핸디캡을 떠나, 3-way 구성시 절대 성능 자체가 크파보다 낮다는 것이죠.
과연 이 양상이 싱글 GPU 성능이 상대적으로 낮은 590에서는 달라질지, 아래의 그래프로 살펴봅시다.


▲ 590의 2-way SLI 효율도 580 x 2와 비슷해 보입니다.
지금까지의 결과들을 보기 쉽게 하나의 그래프로 모아 보겠습니다.


▲ GPU 갯수가 많아질수록 프레임이 200으로 수렴하면서 3-way / 4-way 구성들이 마구 뒤섞이고 있습니다.
같은 GPU 갯수끼리를 비교해 보면, 6990 + 6970이 580 x 3을, 6990 x 2가 590 x 2를 각각 앞서고 있습니다.
아래의 그래프는 순수한 크파/SLI의 효율만을 모아 본 것입니다.


▲ 2-way / 3-way까지의 결과를 보면 크파가 SLI보다 효율이 좋지만, 4-way에서는 반대로 590 두개로 구성된 SLI가 크파를 넘어서고 있습니다. 이는 SLI 자체의 우월성이라기보다는 게임 내의 최대 프레임이 200으로 고정된 상황에서 상대적으로 단일 GPU 성능이 낮은 590이 이득을 본 것 같습니다.

여기까지의 내용을 바탕으로, Battlefield: Bad Company 2 / No AA 모드의 결과를 요약하면 아래와 같습니다.

- 대조군 중 최고 성능: 6990 x 2 (4-way CrossFireX) 구성
- GTX 580 vs 6970 동일 조건 비교시 최고 성능: 6990 + 6970 (3-way CrossFireX) 구성
- CrossFireX vs SLI 효율 비교: 무승부


아래에서는 이 게임에서 4배율 안티알리아싱을 걸었을 때의 결과를 보여 드리도록 하겠습니다.
(즉 원래의 High 옵션보다 안티 배율이 더 늘어난 (2x MSAA -> 4x MSAA) 옵션에서의 테스트 결과입니다)
최대 프레임이 200으로 고정된 상황에서, 안티라는 고부하 옵션이 추가되어 전체적으로 프레임이 낮아질 것이므로 크파/SLI 효율은 앞에서보다는 더 좋게 나타날 것으로 예상해 볼 수 있습니다.


▲ 3-way -> 4-way의 성능향상폭이 여전히 적기는 하지만, 확실히 안티 미적용시보다는 크파 효율이 좋아진 것으로 보입니다.
특히 4-way를 제외하고 보면, 싱글 -> 2-way -> 3-way에서의 성능은 거의 GPU 갯수에 비례해 증가하는 것을 볼 수 있습니다.


▲ 580 SLI 구성도 카드 갯수가 늘어남에 따라 거의 선형적인 성능 향상을 보이고 있습니다.
특히나 이번에는 580이 모든 구성 (싱글 / 2-way / 3-way) 에서 라이벌인 6970/6990을 이기고 있습니다.
다만 GPU 갯수가 늘수록 격차가 좁혀지고 있어서, 4-way끼리 대결했을 때의 승자가 누가 될지 궁금해집니다.


▲ 590 또한 싱글 -> 2-way 효율은 꽤 좋은데, 4-way SLI 효율은 그리 좋아 보이지만은 않습니다.
(누차 언급했지만, 게임 내에서 최대 프레임이 200으로 제한되어 있다는 것을 염두하고 보셔야겠습니다)

그럼 지금까지의 결과값을 하나의 그래프로 정리해 보겠습니다.


▲ 일단 대조군들 중에서 최고 성능은 6990 x 2 (4-way 크파) 가 차지했지만,
580과 6970을 같은 GPU 갯수끼리 비교하면 580 x 3이 6990 + 6970을 이겨 580이 실질적인 승자가 됩니다.
한편 590과 580의 대결을 보면 590 x 2가 580 x 3보다 좋은 성능이긴 하지만 그 차이는 매우 적습니다.
그렇다면, 크파/SLI의 효율을 보면 어떤 양상이 나타날까요?


▲ 일단 2-way 구성시의 효율은 모든 대조군에서 1.9~2배 정도를 보여 큰 편차가 없다고 봐도 무방합니다.
하지만 3-way 효율을 보면 라데온의 경우 세번째 6970이 거의 온전한 비율로 성능을 올려 주는데 비해 580의 경우 세번로 추가된 카드는 제 성능의 70% 정도밖에 더 못 얹어준다는 것을 볼 수 있습니다.
물론 어느 쪽이든 2-way에 비해 확연히 프레임이 오르기는 하지만, 효율을 고려하자면 한번쯤 장고가 필요한 대목입니다.

여기까지의 내용을 바탕으로, Battlefield: Bad Company 2 / 4x AA 모드의 결과를 요약하면 아래와 같습니다.

- 대조군 중 최고 성능: 6990 x 2 (4-way CrossFireX) 구성
- GTX 580 vs 6970 동일 조건 비교시 최고 성능: GTX 580 x 3 (3-way SLI) 구성
- CrossFireX vs SLI 효율 비교: CrossFireX 승


(다음 장에서는 Battlefield 3 / Crysis: Warhead / Crysis 2의 결과를 보여 드리도록 하겠습니다)

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)