본문 바로가기

Review/vga_review

엔비디아 지포스 GTX 465 리뷰

Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)




1. Prologue

2개월 전 nVIDIA의 첫 다이렉트 X 11 지원 GPU로 GF100이 등장할 때 많은 기대를 가졌었습니다.
경쟁사보다 반년 가까이 늦게 신제품을 출시한 만큼 다른 어떤 요소보다도 성능이 주된 관심사였죠.
하지만 막상 뚜껑을 열어보니 당시까지 해결되지 않았던 GF100 칩의 수율 문제로 인해
최고위 라인업인 GTX 480조차 스펙의 1/16을 접고 나와 스타일을 구겼습니다. (512SP -> 480SP)
플래그십 모델에조차 GF100 칩의 완전체를 쓰지 않은 고육책에도 불구하고 GF100 칩의 수급은 좋지 않았고
급기야 GTX 470으로도 만들어지지 못한 채 버려질 칩과 기판을 재활용해 새로운 라인업을 만들어내게 됩니다.
오늘 살펴볼 GTX 465의 등장 배경입니다.


페르미라는 코드명으로 더 익숙한 GF100칩을 간략히 그러보면 위와 같은 구조를 가집니다.
한가운데에 공유 L2 캐시와 디스패치 유닛이 위치하고 그 위 아래에 각각 두개씩
총 네개의 연산 유닛 덩어리가 자리잡고 있습니다. CPU에 비교하자면 쿼드코어와 비슷하다고 할 만 하죠.
각각의 연산 유닛 덩어리는 다시 128개의 쉐이더와 16개의 텍스처 유닛을 포함하며
이 모든 덩어리는 여섯 개로 나눠진 총 48개의 렌더링 파이프라인과 384bit 메모리 컨트롤러에 접속됩니다.
즉 기본 스펙은 쉐이더 512개, 텍스처 유닛 64개, 렌더링 파이프라인 48개, 384bit GDDR5 버스인 것이죠.
전세대인 GT200 칩의 풀스펙이 240 쉐이더 / 32 렌더링 파이프라인 / 512bit GDDR3 인 것과 비교하면
텍스처 유닛을 제외한 나머지 모든 유닛이 적게는 1.5배에서 많게는 두배 이상 오른 것입니다.
(텍스처 유닛은 80개에서 64개로 오히려 20% 줄었습니다.)

GF100칩은 전통적인 GPU의 기능 외에도 범용 '프로세서'로써의 역할을 도모하며 여러 기능을 추가했고
이러한 기능은, 하지만 GF100의 주 구매층이 될 일반 유저들에게는 큰 효용성이 없는 기능일 뿐이었습니다.
주 소비층이 추가된 기능으로 얻을 이득은 거의 없는 상황에서 칩의 사이즈는 불필요하게 거대해졌고
이는 곧 GF100 칩의 낮은 생산률과 (정상적으로 생산됐더라도) 높은 발열/소비전력의 원인이 되었습니다.
하지만 이미 설계해 둔 칩을 어떻게 할 수는 없으니... nVIDIA는 GF100칩의 일부를 막는 방법을 선택합니다.


GTX 400 시리즈의 플래그십 모델인 480은 연산 유닛 중 1/16을 막은 것 외엔 온전한 GF100 칩입니다.
반면에 470은 연산 유닛을 하나 더 막은 것 외에도 렌더링 파이프라인과 메모리컨트롤러의 1/6도 줄어들었고,
465는 아예 '쿼드코어' 중 한개를 통째로 막고 렌더링 파이프라인과 메모리 대역의 1/3을 날려버린 구조입니다.
즉 기반이 된 칩은 같지만 여러 유닛들이 사라짐으로 인해 상당한 성능 차이가 있으리란 예상이 가능합니다.
물론 이런 방식의 하위 라인업 파생은 nVIDIA에서만 볼 수 있는 건 아닙니다.
GTX 400 시리즈의 경쟁상대인 AMD의 라데온 HD 5800 시리즈도 비슷한 방식으로 제조됩니다.


역시 사이프러스란 코드명이 더 유명한 5800 시리즈는 GF100과는 달리 '듀얼코어' 구조에 가깝습니다.
5850은 이들 중 10%에 해당하는 160 스트림프로세서 / 8 텍스처 유닛이 줄어든 것이고,
5830은 480 스트림프로세서 / 24 텍스처 유닛에 더해 렌더링 파이프라인이 절반으로 줄어 버렸습니다.
이 때문에 외견상 화려한 이름과 스펙과는 달리 HD 5830은 5850보다 5770에 훨씬 가까운 성능을 내게 됩니다.

이 벤치에서는 GTX 465를 중심으로, 경쟁 제품들과의 성능을 비교해 465가 시장에서 설 곳을 찾아보려 합니다.


2. Preview


박스에 포함된 내용물입니다. 번들 CD는 사용하지 않아서 그냥 넘어갑니다.
6핀 PCI-E 보조전원을 파워서플라이 4핀 몰렉스로 이어주는 커넥터가 제공됩니다.


근래 출시되는 하이엔드 그래픽카드는 너나할 것 없이 블로워 방식의 쿨러를 사용하는데,
비레퍼런스 기판과 쿨러를 사용한 이 제품은 케이스 내부로 열을 발산시키는 플라워형 쿨러를 사용합니다.
같은 소음수준에서 블로워팬과 일반 팬을 비교하면 일반 팬의 풍량이 더 크기 때문에
그래픽카드만의 열은 더 조용한 환경에서 더 시원하게(?) 식혀 줄 수 있지만 대신 본체 내부가 뜨뜻해집니다.


다른 지포스 형제들보단 오히려 라데온 HD 5800 시리즈를 닮은 출력 패널입니다.
DVI 포트 두개, HDMI / 디스플레이 포트 각 한개를 제공합니다. (DVI <-> D-SUB 젠더 기본 제공)


보조전원으로 6핀 두개를 꼽도록 설계되어 있습니다.
기판 뒷면을 보니 6핀 중 한개는 원래 8핀이 될 수도 있었을 것 같군요.


기판 뒷면 사진입니다.


쿨러를 떼어 보았습니다. 빈 메모리 자리가 있는 것으로 보아 이것도 GTX 470의 기판을 재활용한 것입니다.
다만 램 모듈이 비어 있는데다가 코어에 GF100-030-A3으로 마킹되어 있어 GTX 470으로 개조는 불가능합니다.
(GTX 470으로 개조가 가능한 것은 코어에 GF100-275-A3이라 마킹되어 있다고 합니다.)


전원부는 4...... +1 페이즈입니다. (+1은 메모리쪽에 -_-;; 사진엔 안 나왔네요)
누락된 것 없이 옹기종기 모여 있습니다.


친형제뻘인 GTX 470과의 비교사진입니다. 찍은 이유는 레퍼런스 기판과의 길이 비교를 위해...
보시다시피 레퍼런스 기판보다 짧습니다.


3. Test Setup

외형을 살펴보았으니 본격적으로 성능을 알아 봅시다.

 

우선 테스트 제품들끼리 한컷!



사진에는 5970도 있지만 이 벤치의 대조군은 아닙니다. -_-;
그럼 테스트 대상이 된 그래픽카드의 사양을 간단히 표로 비교해 보겠습니다.


쉐이더 (AMD식 용어로는 스트림프로세서) 는 제조사별로 작동하는 메커니즘이 다른 관계로
저 표에 나타난 숫자를 일대 일로 비교할 수는 없습니다. 그 외엔 보이는 대로 생각하셔도 무방합니다(?)

특이한 점이라면.. 다른 모든 카드들이 1024MB / 256bit 메모리 버스를 사용하는 와중에
GTX 470만이 1280MB / 320bit 버스라는 튀는 스펙을 자랑하고 있습니다.
또한 다른 카드들보다 유난히 빈약해 보이는 HD 5830의 ROP도 눈에 띕니다.
한편, 오늘의 주인공인 GTX 465는 딱히 튀는 스펙은 없는 가운데 텍스처 유닛이 가장 왜소해 보입니다.
중요성이 간과되기 쉬운 텍스처 성능 역시 전체 게임성능을 좌우하는 중요한 요소입니다.

이 카드들을 돌릴 시스템은 아래와 같습니다.

- CPU: AMD Phenom II X6 1090T Black Edition @ 4.2GHz (200MHz x 21)
- M/B: ASUS CROSSHAIR IV FORMULA
- RAM: G.SKILL Perfect Storm DDR3 PC3-16000 CL8 2GB x 3EA
- Storage: Intel X-25M G2 80GB SATA SSD
- PSU: Micronics EXXTREME 1000W 80PLUS GOLD
- Driver: (AMD) Catalyst 10.6 / (nVIDIA) ForceWare 257.21

테스트 항목은 아래와 같습니다.

- 3DMark Vantage
- Aliens vs. Predators 3
- Crysis: Warhead
- DiRT 2
- Heaven 2.1
- Metro 2033

하나의 항목으로도 해상도별로, 안티알리아싱/테셀레이션 옵션별로 가능한 모든 조합을 돌려 보며
안티알리아싱/테셀레이션이 성능에 주는 영향을 알아보고자 하였습니다.

그럼 벤치를 시작하기 전에... GTX 465의 잠재력을 끌어내 줄 최고의 오버클럭 세팅을 찾아봅시다.


4. Overclocking

(사실 필드테스트에 있어서 돌발상황(?)을 막기 위해선 오버클럭은 다른 테스트가 다 끝난 뒤에 해야겠지만...
뭐 그런거 따지기에 앞서~ 저는 제 그래픽카드를 믿었습니다.ㅋㅋㅋㅋㅋ
믿음이 좀만 더했다면 벤치 돌리기도 전에 470 바이오스부터 씌웠을 기세였는걸요ㅋㅋ)

가지고 있는 오버클럭 툴이 리바튜너와 MSI 애프터버너 1.4.1이었는데 둘 다 GTX 465를 지원하지 않았습니다.
제조사에서 제공하는 오버클럭 툴인 "Extertool" 을 사용해서 간단히 오버를 시작했습니다.
전압조절이 불가능한 관계로 한계 클럭까지 도달하는 게 오래 걸리진 않았습니다.


▲ 코어 650MHz / 쉐이더 1300MHz


▲ 코어 700MHz / 쉐이더 1400MHz


▲ 코어 725MHz / 쉐이더 1450MHz
원래는 700 뒤에 750을 시도했지만 에러를 뿜어 클럭 상승분을 반으로 낮췄습니다.
기본클럭이 607.67MHz인 것을 생각하면 725MHz도 이미 20% 가까이 오버된 셈인데...
그래도 여기 만족하기엔 약간 아쉬움이 남죠?
최신 버전 툴에선 GTX 465를 지원하지 않을까 하는 생각에 MSI 애프터버너 최신버전 (1.6.0) 을 받았습니다!


▲ 와우~ 전압 조절까지 지원하네요!
GTX 465의 기본전압은 0.95V인데, 25mV 올린 0.975V에서 750MHz 오버에 성공했습니다.


▲ 코어 775MHz / 쉐이더 1550MHz
전압은 50mV 더 올라간 1.025V 입니다.


▲ 코어 800MHz / 쉐이더 1600MHz @ 1.05V
기본전압보다 100mV 이상 더 주는 것은... 왠지 100이란 숫자가 주는 압박감도 있었고
또 1.075V에서도 825MHz는 에러를 뿜길래 코어 오버는 이 정도 쯤에서 접었습니다.ㅋㅋ

이제 램클럭을 올려 볼 차례입니다.
램 전압은 컨트롤할 수 없으니 금방 한계가 드러나겠죠.


▲ 램 클럭을 정규클럭보다 50MHz 올려 850MHz로 설정한 상태입니다. (GDDR5 유효클럭 3.4GHz)


▲ 램클럭 900MHz (유효 3.6GHz)


▲ 최종 세팅. 램클럭 950MHz (유효 3.8GHz)


▲ 오버클럭 전(위)/후(아래)의 성능을 간단히 비교해 보았습니다. (잠시 후 벤치마크 결과에서도 보겠지만...)
거의 코어클럭 상승분에 비례해서 점수가 올라간 것을 알 수 있습니다.


5. Benchmark Result

크게 두 부류로 나눠, DX10과 DX11의 벤치 결과들끼리 묶어 보여드리겠습니다.

- DX10 -

< 1. 3DMark Vantage >




DX10 기반의 가장 널리 쓰이는 벤치마킹 툴, 3DMark Vantage를 돌려 본 결과입니다.
실제 게임 성능과 반드시 일치한다기보다는 그래픽카드의 쉐이더 성능이 과장되게 반영되는 경향이 있습니다.
기본 클럭의 GTX 465가 꼴지를 독점하고 있고, 오버클럭된 GTX 465의 성능은 상당히 좋은 편입니다.
특히 경쟁상대라고 여겼던 HD 5830보다도 작지 않은 차이로 뒤지는 모습이 살짝 불안해 보입니다.
(퍼포먼스 프리셋에서의 차이는 큰 편이고, 고해상도로 올라갈수록 차이가 좁혀지긴 합니다.)
대체로 오버클럭된 465와 470, 5850의 성능이 엇비슷한 것 같습니다.


< 2. Crysis: Warhead >



출시된 지 2년이 넘게 지났지만 아직까지도 '빡센 게임'의 대명사격인 크라이시스를 돌려 보았습니다.
옵션을 어떻게 주느냐에 따라 플레이 환경이 많이 달라집니다.
보통 중소형 와이드 모니터의 해상도인 1680x1050 하에서 안티알리아싱을 걸지 않으면
위의 카드 중 어떤 것으로도 무난한 플레이가 가능합니다. (평균 30프레임 이상)

어떤 옵션에서도 카드들의 순위는 일정하게 유지됩니다.
다만 고해상도 + 안티알리아싱의 조합일수록 라데온들과 하위 제품간의 격차가 줄어드는 모습이 보입니다.
라데온들이 안티알리아싱을 걸었을 때 성능저하 폭이 상대적으로 크다고 생각해볼 수 있습니다.


< 3. Metro 2033 - DirectX 10 >



크라이시스의 뒤를 잇는 '빡센 게임' 메트로 2033입니다. 같은 제목의 소설을 원작으로 만들어졌죠.
이 게임의 진가는 DX11로 돌리는 것이지만 DX10에서도 초고해상도 텍스처를 맛보기엔 부족함이 없습니다.
1680x1050 해상도에서 안티알리아싱을 걸지 않은 때를 제외하면 프레임이 거의 전멸입니다.
안티알리아싱을 걸지 않은 1920x1200 해상도에서도 5870만이 간신히 평균 30프레임을 넘겼습니다.
또한 여기서도 안티알리아싱이 걸렸을 때 라데온들의 성능하락률이 큰 편입니다.

여기서 눈여겨 볼 것은 오버클럭된 465가 470에 매번 간발의 차이로 뒤지는 모습인데,
앞서 살펴본 오버클럭 테스트에서 3DMark 점수 (=쉐이더 성능) 은 더 잘 나왔던 것과는 대조적입니다.
테스트 그래픽카드의 스펙을 비교한 표에서 보았듯이 465는 텍스처 유닛이 470에 비해 많이 부족한 편인데
고해상도의 텍스처를 처리해야 하는 이 게임에서 텍스처 유닛이 병목현상을 초래한 게 아닐까 싶습니다.

그럼, 가장 빡센 예제들로 DX10 성능을 살펴봤으니 이제 DX11로 옮겨가 봅시다.


- DX11 -

< 4. Heaven 2.1 >




다이렉트X 11을 지원하는 첫 벤치마킹 툴입니다. 대단히 많은 테셀레이션 예제를 포함하고 있습니다.
(분량이 많아 부득이하게 해상도별이 아닌 옵션별로 그래프를 나눴습니다.)
위에서부터 차례로 테셀레이션 레벨 0 (disable), 레벨 50 (Normal), 레벨 100 (Extreme) 일 때의 결과입니다.
첫 그래프에선 얼핏 라데온들이 상위권을 차지했나 싶지만 이 벤치에선 대체로 nVIDIA가 강세입니다.
테셀레이션 레벨에 따라 순위가 요동치는데, 테셀레이션 레벨이 높을수록 GTX 400 시리즈가 유리한 편입니다.
(다만 그 '유리한' 결과도 20프레임을 넘기 힘들다는 게 문제...)
아직까지는 현존하는 어떤 그래픽카드로도 제대로 된 테셀레이션 효과를 써먹기는 어려울 것 같습니다.

또한 오버클럭된 465는 대체로 470보다 빠른 편이지만, 안티알리아싱이 걸리면 역전됩니다.
더 넉넉한 그래픽 메모리를 탑재한 470이 안티알리아싱이 걸릴 때 성능하락이 더 적을 것이라 유추해 봅니다.




1920x1200 해상도에서도 결과는 별반 다르지 않습니다. 여기서도 프레임은 안습이군요;;
위에서도 확인한 결과지만 테셀레이션 레벨이 오를수록 지포스보다 라데온들의 성능하락이 더 가파릅니다.
GTX 470을 기준으로, 테셀레이션 레벨 0에서 50/100으로 넘어갈 때 21.6%/37.0%의 성능하락이 있었는데
HD 5870은 33.4%/56.0%로 하락폭이 거의 두 배 가까이 됩니다.


< 5. DiRT 2 >



다이렉트X 11을 지원하는 레이싱 게임 DiRT2 입니다.
그동안의 꽉 막힌 듯한 프레임을 보다가 더트2를 플레이하는 순간 숨이 트이는 기분이었습니다.ㅠㅠ
각설하고. 일단 이 게임에서는 어떤 카드도 / 어떤 해상도/옵션에서도 원활한 플레이가 가능합니다.
오랜만에 라이벌인 HD 5830과 GTX 465얘기를 해 보자면... 대체로 5830보다 465가 더 우세한 편입니다.
다만 1920x1200 해상도에서 안티알리아싱이 걸리면 5830이 465를 근소한 차이로 앞섭니다.
그동안 봐온 결과와는 달리 더트2에서만큼은 안티알리아싱에 지포스가 더 약한 모습을 보이고 있습니다.
같은 맥락에서, 안티알리아싱 미적용시에는 오버클럭된 465나 470이 5850보다 성능이 좋지만
안티알리아싱을 적용하면 5850이 그 둘을 앞서는 것을 볼 수 있습니다.


< 6. Aliens vs. Predators 3 >



일단 헤븐 벤치와는 달리 테셀레이션보다는 안티알리아싱이 프레임에 미치는 영향이 훨씬 더 큽니다.
(테셀레이션 온/오프시 프레임 차이는 많아야 1~2 프레임 내외...)



안티알리아싱이 적용되었느냐 아니냐에 따라 465와 5830, 465 OC와 470이 엎치락뒤치락 합니다.
(안티알리아싱이 적용된 경우 두 대조그룹 모두 후자가 유리합니다.)
또한 안티알리아싱의 적용여부에 따라 5850과 470의 순위도 엎치락뒤치락 하는데,
확실히 더 큰 그래픽메모리와 더 넉넉한 대역폭을 가진 470이 안티알리아싱에 여유롭게 대처하는 듯 보입니다.


< 7. Metro 2033 - DirectX 11 >



우선 앞의 테스트들과 달리 DX11 모드 메트로 2033은 HD 5830으로 실행이 불가능했습니다.
다른 곳의 벤치마크 결과를 보면 분명 5830도 가능한데... 제품이나 프로그램에 문제가 있는 것 같습니다.
일단 테셀레이션 Off 상태를 기준으로, 앞서 살펴본 DX10 모드보다 30~40% 정도 하락한 프레임을 보입니다.
또한 테셀레이션 On/Off에 따라 순위가 요동치고, 안티알리아싱까지 더해질 경우 지포스가 확연히 강세이지만
이미 저 프레임으로는 누구도 게임을 원활하게 즐길 수 없는 상황입니다. -_-;;



앞의 벤치들에서 470과 비슷하게 놀던 465 OC는 이 벤치에서만큼은 470을 따라잡지 못하고 있습니다.
하지만 대체로 5850보다는 오버클럭된 465가 더 빠른 성능을 보여줍니다.
HD 5870 기준으로 테셀레이션 적용시 약 33.9%의 성능 하락이 있는 데 비해
GTX 470은 테셀레이션을 적용해도 떨어지는 프레임 수 비율이 10% 미만입니다.
확실히 GTX 400 시리즈가 테셀레이션에 더 유리한 구조임을 알 수 있습니다.
또한 전반적으로 특이한 점이라면 1680x1050 해상도일 때보다 1920x1200 해상도일 때
각종 옵션이 걸릴 때 프레임 하락률이 훨씬 더 크다는 것입니다.
이제 1024MB 1280MB 할 것 없이 다들 그래픽메모리의 한계가 드러나는 것 같습니다.


6. Discussion

게임마다 다르지만 대체로 안티알리아싱이 걸리면 GTX 465는 불리한 영향을 많이 받았습니다.
넉넉한 메모리용량과 대역폭을 가진 GTX 470과도 다른 465의 태생적인 한계라고 볼 수 있는 점입니다.
또한 이런 경향은 고해상도에서 두드러져, 1920x1200 이상 해상도에서 풀옵션으로 게임을 하는 사람이라면
굳이 GTX 465가 타겟이 되어야 할 이유는 없다고 생각할 수 있습니다.

물론 465는 5830보다 전반적으로 빠른 것은 분명하고, 일부 게임에서는 5850보다도 빠르기도 하지만
465의 가격 자체가 이미 5830보다는 훨씬 비싸고 5850과 엇비슷하다는 게 구매욕을 떨어뜨리는 요인입니다.
(또 문제는 465로 쾌적하게 돌릴 수 있는 게임이라면 그 아랫급 -GTX 275, 260 등- 으로도 충분히 가능한데
GTX 465의 가격이 그들보다 훨씬 비싸다는 것도 있습니다.)

다만 고해상도에서 어떤 카드로든 돌리기 힘든 크라이시스나 메트로 2033 같은 게임을 생각해 보면...
특히 테셀레이션 적용여부에 따라 프레임 차이가 나는 메트로 2033을 플레이하고 싶은 유저라면
1680x1050 이하 해상도를 사용한다는 전제 하에 GTX 465를 구입하는 것도 나쁘지 않은 선택입니다.
또한 프로그램의 미비로 체계적인 벤치자료를 구축할 수는 없었지만
CUDA를 지원하는 툴로 인코딩을 해 본 결과 CPU 가속은 물론 5850보다도 빠른 성능을 보였습니다.
아직까지 ATi stream에 비해 더 범용적이고 널리 쓰이는 CUDA의 장점은 분명합니다.

요약하자면, 단순히 일반적인 게임에서의 성능만 보자면 굳이 GTX 465를 살 메리트는 없지만
엔비디아 제품만이 제공할 수 있는 기능을 원한다면 GTX 465도 괜찮은 선택이 될 수 있을 겁니다.


7. +α ?!

테스트를 마치고 홀가분한 기분으로...
테스트를 하는 동안 미뤄왔던 도박을 감행했습니다.
공짜로 생긴 카드라 부담이 없기도 했고
설사 고장나더라도......... 설마 AS를 안해주겠어??? 하는 근거없는 믿음으로 ㅎㅎㅎ
솔직히 벽돌이 될 각오를 하고... 시도한 그것은!!

G.T.X.4.7.0. 바.이.오.스. 씌.우.기....

.
.
.
.
.


오옷!!! 업데잇 석세스풀???
재부팅해 보았습니다.


쳇... 그대로잖아......

...자세히 보면 그대로는 아니고, 메모리 클럭만 470 기본 메모리클럭대로 살포시 올랐습니다.
에잇~ 김샌다...ㅋㅋ


긴 글 읽어 주셔서 감사합니다...^^

 

//

 

(아래 위젯은 티스토리의 크라우드펀딩 시스템인 '밀어주기' 위젯입니다. 100원부터 3000원까지의 범위 내에서 글쓴이에게 소액 기부가 가능합니다. 사견으로는 이러한 형태의 펀딩이야말로, 성공적으로 정착될 경우 이해관계자로부터 독립된 벤치마크가 지속가능해지는 원동력이 될 것이라 생각합니다. 제가 작성한 글이 후원할만한 가치가 있다고 여기신다면 밀어주기를 통한 후원을 부탁드립니다. 물론 글을 '가치있게' 쓰는 것은 오롯이 저의 몫이며, 설령 제 글이 '후원할 만큼 가치있게' 여겨지지는 못해 결과적으로 후원을 받지 못하더라도 그것이 독자 여러분의 잘못이 아니란 건 너무 당연해 굳이 언급할 필요도 없겠습니다. 저는 후원 여부와 관계없이 제 글을 읽어주시는 모든 독자분께 감사합니다.)