Author : Daeguen Lee

(Any action violating either copyright laws or CCL policy of the original source is strictly prohibited)





딥러닝 신경망추론에 특화된 테슬라 2종이 발표되었습니다. P40 / P4가 그들입니다. 이들은 GP102 / GP104 풀칩을 탑재했으며 특히 후자는 거대한 GPU를 탑재했음에도 작동 속도를 수백 메가헤르츠 단위로 떨어뜨려 보조전원 없는 TDP 상한선 75W에 맞춘 것이 흥미롭습니다.


이 글에서는 GP100과 GP102의 차이에 집중해 보았는데요. 아시다시피 엔비디아는 GP100 기반의 테슬라 P100을 이미 발표한 바 있습니다. 굳이 GP102 기반의 테슬라를 추가한 이유는 무엇일까요? 게다가 전자는 컷팅칩, 후자는 풀칩. 쿠다코어는 후자가 더 많은데 그럼 둘 사이의 서열은?


결론만 얘기하자면 GP100은 HPC에 널리 쓰이는 FP64와 신경망훈련에 널리 쓰이는 FP16 연산을, GP102 / GP104는 신경망추론에 널리 쓰이는 INT8 연산을 각기 배타적으로 수행할 수 있습니다. GP100보다 GP102가 더 간소한 구성의(FP64 / HBM2의 배제 등) 저가형 칩셋이기는 하나 용도를 살펴보면 둘은 상하관계라기보다는 서로 다른 곳을 겨냥한 '투톱' 이라 보는 편이 더 정확하겠죠.


백문이 불여일견. 엔비디아의 HPC시장 전략에 관한 닥터몰라의 분석을 여러분과 공유합니다. 부디 재미있게 읽어 주시길.



※ 전체 글은 다음 주소에서 보실 수 있습니다 : http://drmola.com/news/77217



저작자 표시 비영리 동일 조건 변경 허락
신고