폴라리스, 라데온 9700을 꿈꾸다 : 9000 시절의 재림 노리는 AMD
올해는 그래픽카드 업계에 대단히 의미있는 한 해가 될 것이다. 단 둘뿐인 독립 GPU 제조사 AMD와 엔비디아 모두 만 4년만에 28nm 공정을 벗어날 것이 확실시되기 때문이다. 이들이 공염불한 시간 동안 인텔은 22nm를 거쳐 14nm의 영역에 도달했으며 인텔처럼 성큼성큼 나아갈 여력이 없는 모바일 칩셋 시장마저 20nm, 16nm를 거쳐 마찬가지로 14nm를 향해 내달리고 있다. AMD와 엔비디아가 올해 14/16nm 핀펫 공정 기반의 새 GPU를 출시한다는 소식은 선도업체의 그것이라기엔 차라리 만시지탄에 가깝다. 제조기술이 정체된 동안 AMD는 두 번의, 엔비디아는 세 번의 플래그십 교체를 단행했으나 사용자들은 여전히 '그 너머'의 무언가를 응시하기를 멈추지 않는다. 여전히 성능에 목마른 채.
28nm 공정을 채택한 최초의 상용 GPU는 AMD에서 테이프를 끊었다. 당대로서는 전혀 새로운 아키텍처 '그래픽 코어 넥스트'(GCN)에 기반한 '타히티'의 성능은 가히 경이로운 수준이었지만 그것보다도 사용자들을 놀라게 한 것은 이 제품의 양호한 소비전력에 있었다. 성능이 폭발적으로 증가했음에도 소비전력이 전세대 수준에 머물렀으니 달리 말하자면 전성비가 획기적으로 개선된 것이다. 이러한 유저들의 기대치는 뒤이어 등장한 28nm 후발대에도 마찬가지로 적용되었고, 그 기준의 연장선에서 합격점을 받은 케플러와 맥스웰은 높은 인기를 누린 반면 여기 다소 못 미쳤던 하와이는 그들보다 적은 판매고에 만족해야 했다. 차세대 게이밍 환경을 겨냥한 피지는 HBM이라는 회심의 무기를 탑재해 반전을 꾀했으나 지나치게 멀리 본 '차세대 게이밍 환경'은 아직 도래하지 않았고, 따라서 반전 역시 아직 일어나지 않았다. 다만 시간이 흐를수록 긍정적으로 재평가되고 있다는 점이 위안이 될까. 사실 이 모든 것을 떠나 피지는 공급이 수요를 도저히 못 따라가는 극도의 물량 부족에 시달리고 있으며 HBM/인터포저의 수급 문제만큼이나 28nm 공정으로서는 이례적일 만큼 거대한 다이가 당당히 한몫하고 있음이 분명하다. (피지의 다이 크기는 600mm2에 육박한다) 무려 4년을 끌어온 28nm 제조공정이, 더는 유지될 수 없다고 비명을 지르는 것이다.
2016년 벽두에 AMD와 엔비디아가 앞서거니 뒤서거니 신공정에 기반한 자사의 차세대 GPU들을 띄운 것은 바로 그러한 이유에서일 것이다. 그러나 연초의 패기로운 발표와는 정 반대로 양사 모두 '본격적인' 신제품의 투입은 늦어지는 것이 기정사실화되고 있으며(링크), VRAM 용량을 두 배로 늘린 쿼드로 M6000을 출시한 엔비디아의 행보나 피지 GPU를 두 개 탑재한 라데온 프로 듀오를 발표(링크) 한 AMD의 행보 역시 이에 닿아 있다. 핵심은 피지의 수급을 나쁘게 한 원인인 HBM처럼 HBM2 양산이 올해 말에나 예정되었다는 점과 신공정의 안정화에 어려움을 겪는 파운드리의 사정이 겹친 데 있다. 자연히, 그리고 공정 전환기에 으레 그랬듯, 신공정을 적용한 양사의 차세대 GPU가 플래그십보다는 상대적으로 부담이 적은 메인스트림-로우엔드급에서 신고식을 치르리란 관측이 제기된다. AMD는 HBM2를 내년의 '베가' 부터 적용한다는 것으로, 엔비디아는 올해 출시될 제품에 GDDR5 메모리를 고수한다는 것으로 각각 이러한 관측을 시인한 상태이다.
이것은 그리 놀라운 소식이 아니다. 땅이 꺼져라 한숨 쉴 것도 없다. 흔히 40nm GPU 시대를 열어젖힌 주역으로 AMD의 에버그린과 엔비디아의 페르미를 나란히 생각하기 쉽지만, 실은 그보다 한해 전 40nm 테스트베드 역할을 맡은 AMD의 라데온 HD 4770이 있었다. 비록 그 자체는 처참한 수율로 도저히 수급을 맞추지 못해 예비 구매자들의 입맛만 버려놓은 채 단종 수순을 밟았으나 40nm '빅 칩'을 차질 없이 만들어내는 밑거름 역할을 톡톡히 했다. 만일 폴라리스나 파스칼의 첫 데뷔작이 하이엔드 플래그십이 아니더라도 이는 예상 가능한 범위 안의 움직임이다. 나아가 이를 거꾸로 적용해, 55nm GPU가 주류이던 시절 최초의 40nm GPU 라데온 HD 4770이 가졌던 위상을 조만간 등장할 1세대 폴라리스/파스칼의 체급에 대입해 볼 수도 있겠다. 이러한 기조에서 볼 때, 꽤 의미있는 정보가 최근 유출되었다. 물론 AMD 진영에서다.
한 리눅스 커뮤니티는 AMD의 새로운 드라이버에 지금까지 없던 코드네임과 디바이스ID가 추가된 것을 포착해 리포트한 바 있다. 당시만 하더라도 이 자체로는 (물론 AMD의 차기 그래픽카드라는 확실한 심증은 있었으나) 아무런 정보가 되지 않는 것이었지만, 재차 버전업을 거치며 당시의 코드네임과 현재 AMD로부터 공인된 '공식 코드네임' 사이의 연결성이 생기면서부터는 순식간에 이슈의 중심이 되었다. 위 그림과 같다.
캐나다 북부의 섬 Ellesmere(엘즈미어 섬), Baffin(배핀 섬)으로 각각 알려졌던 이들은 한 차례 리뉴얼을 거쳐 폴라리스 10, 폴라리스 11로 개명되었다. 차세대 GPU 패밀리의 이름이 폴라리스로 붙여지기 전 이들이 '북극섬'(Arctic Islands)으로 불렸음을 상기하자. 알다시피 캐나다는 북극해와 접하고 있다. 위의 코드는 단지 이들 '북극섬'들이 폴라리스 패밀리에 편입되었다는 사실 외에 몇 가지 중요한 점을 시사하는데, 가령 그 중 한 가지를 꼽자면 폴라리스 10은 두 가지 버전으로 제공될 것이라는 점이다. 타히티, 하와이, 심지어 최근의 피지까지도 풀 칩과 컷팅 칩의 두 버전을 파생한 바 있으니 상상하기 어려운 일은 아니다.
더 재미있는 사건은 그로부터 며칠 지나 벌어졌다. 한 호기심 많은 유저가 코드로부터 드러난 정체불명의 디바이스ID를 Sisoft Sandra 벤치마크 DB에 검색해 보았더니 놀랍게도 대응하는 모델이 있던 것이다. 정황상 AMD 내부, 혹은 그들의 의뢰 하에 긴밀히 협조하는 누군가 사전 테스트 차원에서 등록한 것으로 짐작된다. 이에 따르면 지금까지 알 수 없었던, 좀 더 상세한 정보가 펼쳐진다. (링크)
앞서 살펴본 폴라리스 10의 디바이스ID는 0x67C0과 0x67DF의 2종인데, 산술적으로 후순위인 0x67DF가 하위 사양의 GPU라 가정하자면 위 사진에 드러난 사양이 바로 '폴라리스 10의 컷팅 칩'의 그것이 된다. 우선 컴퓨트 유닛(CU) 구성으로부터 유추할 수 있는 가장 보수적인 예측은, 폴라리스 10의 CU 구성은 기본적으로 (한번이라도 설계해본 것을 다시 설계하는 편이 더 손쉬울 것이기에) 하와이와 비슷하리라는 것이다. 하와이는 44개의 CU를 탑재해 총 2816개의 스트림프로세서를 갖추고 있었고, 그 컷팅 칩인 라데온 R9 290/390은 CU 4개가 비활성화되어 2560개의 스트림프로세서 구성을 가졌었다. 그러나 당시 AMD의 이런 차별화 정책은 성공적이었다고는 보기 힘든 것이, 컷팅 칩이 왕왕 풀 칩으로 변신하는 것은 둘째치더라도 같은 클럭일 때 컷팅 칩과 풀 칩의 성능이 지나치게 비슷했던 것이다. 290과 290X, 390과 390X의 관계를 생각해보자. 만약 폴라리스 10의 풀 칩이 44CU 구성이 맞다면, AMD가 이번에는 과거의 실수를 되풀이하지 않고자 '조금 더' 풀 칩과 컷팅 칩 사이의 거리를 띄우도록 의도했을 가능성이 높다. 위에 나타난 36CU, 2304 스트림프로세서라는 수치는 그렇게 얻어진다.
또 한가지 재미있는 점이라면 폴라리스 10 컷팅 칩 기반 그래픽카드가 256bit GDDR5 인터페이스를 사용했다는 점이다. 일단 실제로 GDDR5가 쓰였다는 전제 하에 폴라리스 10에서는 HBM을 보지 못할 가능성이 매우 높아졌다고 볼 수 있다. 최선의 경우라도 GDDR5X 정도가 한계일 게다. 그러나 그보다 더 큰 함의를 갖는 것은 바로 비트레이트가 256bit라는 부분에 있는데, 재미있게도 현재 AMD 라인업의 중간층을 담당하는 통가 GPU가 이와 같은 메모리 사양을 갖춰 출시되고 있기 때문이다. 55nm GPU가 주류이던 시절 혜성같이 등장한 라데온 HD 4770의 위치가 바로 지금의 통가의 자리이기도 한 까닭에, 폴라리스 10은 실제로 라데온 R9 380/380X를 대체하는 포지션에 투입될 가능성이 매우 큰 것으로 여겨진다.
라데온 R9 380X는 2048개의 스트림프로세서와 256bit GDDR5 메모리를 탑재하고 있다. 여기서 스트림프로세서가 12.5% 증가한 '라데온 R9 480'을 상상하기란 그리 어렵지 않다. 어쩌면 폴라리스 10의 풀 칩에는 (통가의 풀 칩이 그러했듯) 384bit의 메모리 채널이 모두 살아나 2816 스트림프로세서와 짝을 맞출지도 모르는 일이다. 이 경우 폴라리스 10 풀 칩에 기반한 그래픽카드 (아마도 라데온 R9 480X 혹은 485) 는 라데온 R9 390/390X의 자리를 대체할 가능성이 높다. 혹여나 그 정도 GPU 성능에 384bit의 메모리 대역이 부족해 보인다면, 통가부터 AMD는 컬러 압축 기술을 통해 명목 대역폭의 1.4배 정도에 해당하는 실질 대역폭을 갖게 되었음을 되새기자. 384와 512의 차이는 그야말로 명목상의 숫자에 불과하게 되었다.
폴라리스의 투입으로 AMD가 노리는 바는 아주 명확하다. 위 슬라이드는 AMD(ATI)가 2000년대 초반에 행한 실패와 성공사례를 대비하고 있다. '라데온' 브랜드의 시작이었던 라데온 256은 좋은 출발을 보였으나 이듬해 그 리네이밍 모델인 라데온 7000을 투입한 것은 매우 나쁜 결정이었다. 라데온 8000 시리즈가 늦어지는 사이 엔비디아는 지포스2, 지포스3을 출시해 점유율을 한껏 높이고 있었다. 반면 절치부심한 끝에 내놓은 9000 시리즈는 그야말로 대박이었다. 설상가상 엔비디아가 FX 시리즈의 부진에 시달리는 동안 라데온 9700은 하이엔드 시장을 완전히 평정했고, 이 시기 ATI는 처음이자 마지막으로 엔비디아를 넘는 시장 점유율을 기록하기에 이른다. 서니베일판 '어게인 2002'랄까, AMD는 그때의 꿈을 꾼다.
거두절미하고, 과연 가능한 목표인지 의문이 생긴다. 위 그래프가 그려질 당시보다도 현재 AMD는 더 낮은 점유율로 곤두박질했으며 엔비디아는 창사 이래 최대 분기 매출을 경신하고 있는 중이기에 더 그렇다. 글로벌 세일즈 비율이 8:2까지 벌어진 상황에, 추월은 고사하고라도 5:5, 6:4에 근접이라도 할 수 있겠느냐는 의문이 제기되지만 어쨌든 AMD는 앞의 슬라이드를 투자자들 앞에 내보임으로써 이를 공식화했다. 사실 시장점유율을 높이는 것은 그리 어려운 일이 아니다. 경쟁사보다 더 좋은 성능의 제품을 더 싸게 공급하면 그만이다. 둘 중 하나가 안 될 때에는 다른 하나라도 확실히 해야 일말의 기회가 온다. 폴라리스를 통해 라데온 9700의 꿈을 이루려 한다면 그들이 나아가야 할 길은 명확하다. 경쟁사의 동 체급 제품보다 더 좋은 성능의 폴라리스를, 더 싸게 내놓아야 한다.
앞서 살펴본 폴라리스 10의 성능은 컷팅 칩이 라데온 R9 380X와 390의 사이, 풀 칩은 390/390X의 언저리가 될 것으로 보인다. 이들이 가령, 파격적으로 현재의 라데온 R9 370/370X 가격대에 배치된다면 어떨까. 2.5배의 전성비 향상을 이뤘다는 선전을 액면 그대로 믿자면 폴라리스 10의 TDP는 100W 근처가 될 것이다. 전전세대 플래그십과 같은 성능에 6핀 보조전원 하나만 요구하는 10만원 후반대 그래픽카드. 아주 그럴싸하지 않은가. AMD가 진정 라데온 9000 시절의 재림을 목표한다면 적어도 이 정도 각오를 갖고 나와야 할 것이다.
'컴퓨터 관련 소식' 카테고리의 다른 글
파스칼 아키텍처 분석 : 역대 최고 넓이의 프론트엔드, IPC 25~30% 가량 개선 전망 (0) | 2016.04.19 |
---|---|
SilverStone RAVEN RVZ02B-W iBORA : 포토 프리뷰 (0) | 2016.04.01 |
ESSENCORE, KLEVV DDR4 CRAS 8G PC4-24000 CL16 (4Gx2) Dual Kit : 포토 프리뷰 (0) | 2016.04.01 |
ASRock E3V5 Gaming/OC(디앤디컴) - 오버클럭 가이드 (0) | 2016.03.25 |
ASUS B150I PRO GAMING WIFI AURA : 포토 프리뷰 (0) | 2016.03.25 |