1. FirePro S7150 / S7150 x2 :
하드웨어 가상화에 최적화된 멀티유저 VM 솔루션
지난 2월 1일 AMD의 서버용 그래픽카드 라인업에 작은 변화가 있었다. 하드웨어 가상화를 지원하는 첫 솔루션인 FirePro S7150 및 S7150 x2를 라인업에 추가한 것이다. 이들은 모두 Tonga 칩셋을 탑재하고 있으며 원격 워크스테이션, 클라우드 게이밍/컴퓨팅 및 가상 데스크탑 인프라(VDI) 등 오늘날 떠오르는 화두인 '가상화'에 대응하는 제품이다.
지난해 8월 AMD는 VMWorld 2015 행사에서 정체불명의 다중 사용자용 그래픽카드를 최초로 시연했던 바 있다. 오늘 FirePro S7150 / S7150 x2를 발표함에 따라 당시 시연한 모델이 이들 중 하나라는 사실이 간접적으로 확인된 셈이다. 이들은 모두 AMD의 최신 그래픽 아키텍처인 GCN 1.2 기반의 Tonga 칩셋을 탑재하고 있으며, 가상 머신(VM) 전반에 걸쳐 예측가능성과 관리 가능성을 제공하기 위해 가상화 표준규격인 PCI-Express SR-IOV(Single Root I/O Virtualization)을 채택하고 있다. 간단히 특징을 열거하자면 아래와 같다.
- 하드웨어 GPU 스케줄러를 통해 고도로 정밀한 품질의 서비스(high precision quality of service) 제공
- 하드웨어 레벨의 메모리 격리 로직(memory isolation logic)을 통해 가상 머신(VM)간의 데이터 오염 방지
- DirectX, OpenGL 등 그래픽 API뿐 아니라 OpenCL 등 컴퓨팅 API에서도 완전한 가상화를 지원할 수 있도록 어플리케이션 레벨에서 GPU의 모든 자원 활용
이외에도, 이들이 공통적으로 공유하는 특징 및 기능은 아래와 같다.
- ECC 메모리를 탑재하여 고정밀도 연산 정확도 개선
- AMD 파워튠(PowerTune) 기술을 통해 GPU의 활동과 소비전력을 복합적으로 고려한 효율적인 운용 지원
FirePro S7150은 풀스펙의 단일 Tonga 칩셋을 탑재하고 있으며 2048개의 스트림프로세서와 8GB의 GDDR5 VRAM을 지원한다. TDP는 150W로 PCI-Express 8핀 보조전원 커넥터 하나가 들어간다. 최대 16개의 VM을 구동할 수 있으며 서버의 형태에 따라 액티브/패시브 쿨링 형태로 선택하여 주문할 수 있다. 가격은 2400달러.
FirePro S7150 x2는 다른 모든 것이 S7150과 같지만 풀스펙의 Tonga 칩셋이 두개 탑재되었단 점이 다르다. 이에 따라 총 4096개의 스트림프로세서를 탑재하고 있는데 이는 AMD의 최신 칩셋인 Fiji와 동일한 것이다. 각 GPU당 8GB씩 총 16GB의 GDDR5 VRAM을 탑재하고 있으며 TDP는 265W, 보조전원 구성은 알려지지 않았다. 최대 32개의 VM을 구동할 수 있고 패시브 쿨링 형태로만 제공될 것이라고 한다. 즉 위의 이미지는 단지 보도용으로만 작성되었을 가능성이 높다. 가격은 4000달러.
한편, AMD는 금번 신제품과 관련하여 주요 OEM 생산자 긴밀히 협력해 고성능 VM 워크스테이션 구성 및 기업 고객을 위한 원스톱 유지보수 서비스를 지원할 것이라 밝혔다. 이외에도 하드웨어 레벨 VM간 메모리 격리를 바탕으로 뛰어난 데이터 보안을 제공하며, 일반적으로 VDI가 활용되는 CAD, 미디어, 엔터테인먼트, 사무용 애플리케이션과 같은 분야에서 업계 최초 VGA 기반 가상화를 지원함으로써 가격 대비 뛰어난 다중 작업환경을 구축할 수 있게 되었다고 전했다. 이와 관련한 AMD 및 협력사의 공식적인 코멘트는 아래와 같다.
끝으로, 수차례 언급했듯 AMD가 현 세대에서 경쟁사에 대해 누릴 수 있는 비교우위로는 GPU의 연산성능과 높은 확장성(scalability, 멀티 GPU 효율)을 꼽을 수 있는데 금번 FirePro S7150 / S7150 x2(특히 후자)의 출시를 통해 AMD가 서버 부문에서도 이러한 이니셔티브를 놓지 않겠다는 의지를 과시했다고도 해석할 수 있을 것이다. 그리고 Tonga 칩셋 기반의 FirePro S7150 x2를 출시함으로써 이제 더는 AMD가 시선을 돌릴 다른 제품이 남지 않았다고도 생각한다. 모두의 시선은 유일하게 남겨진 -게다가 미리 공언되었던- AMD의 게이밍 듀얼 GPU 그래픽카드인 코드네임 'Gemini'에 쏠리고 있다. 해 뜨기 전이 가장 어둡다는 얘기가 있듯 지금은 이에 관한 어떤 유의미한 정보도 흘러나오고 있지 않은 상황이라 신제품에 대한 사용자들의 갈증은 커져만 간다. AMD가 너무 늦지 않게 기다림의 결실을 보여 주길 바래 본다.
2. A10-7890K, A10-7860K, A6-7470, 그리고 애슬론 X4 845 :
그래픽 강화한 뉴 고다바리와 최후의 모듈 아키텍처 '엑스카베이터'의 등장
한편 AMD는 그로부터 이틀 뒤인 지난 3일, 3종의 새로운 APU와 1종의 새로운 CPU를 발표하여 데스크탑 프로세서 라인업에도 약간의 변화를 가했다. 지난 7월 '고다바리'라는 코드네임으로 불리던 A10-7870K 등이 추가되기는 했으나 사실상 카베리를 이름만 바꾼 수준이었던 것을 고려하면 2014년 1월 카베리의 출시 이후 2년간 전혀 변화가 없었다고 볼 수도 있었는데, 다행히 이번 개편에서는 의미 있는 신제품이 하나 추가되었다. 공교롭게도 그날 출시된 제품 중 가장 막내격인 애슬론 X4 845가 바로 그것이었다.
프로세서의 발전 속도가 대중의 인식을 초월해 빨라짐에 따라 인텔과 AMD 공히 자사의 플래그십 브랜드를 엔트리급의 그것으로 격하시킨 지 거의 10년이 되어가는 요즘이다. 펜티엄과 애슬론이라는 정겨운 이름들이 그러한 트렌드의 직격탄을 맞아 오늘날 이들을 고성능 CPU에 붙는 이름으로 생각할 사람은 아무도 없으리라 믿는다. 그렇더라도 이들이 한때 프로세서 시장을 호령하던 이름이었단 사실이 없어지지는 않는다. 인텔은 작년 '펜티엄' 브랜드의 출시 20주년을 맞아 1997년의 펜티엄 II 이래 처음으로 배수제한을 해제한 '펜티엄 G3258'을 출시해 쏠쏠한 재미를 본 바 있는데, 물론 이를 의식한 건 아니겠으나 AMD 역시 금번 발표를 통해 데스크탑 시장에 등장하지 못할 뻔 했던 '엑스카베이터' 아키텍처를 애슬론 브랜드를 통해 처음이자 마지막으로 선보이게 되었다. 펜티엄 G3258과 마찬가지로 상위 라인업보다 해당 제품이 더 돋보이게 된 이례적인 케이스라고 의미를 부여할 수 있겠다.
우선 AMD의 현 프로세서 라인업 체계부터 살펴보도록 하자. 아래 그림에 설명되었듯 AMD의 프로세서 라인업은 크게 내장그래픽 없는 'CPU' 와 내장그래픽이 포함된 'APU'로 나뉜다.
이 중에서도, CPU는 다시 퍼포먼스 세그먼트를 공략하는 FX 라인업과 메인스트림을 공략하는 애슬론으로 나뉘며, APU는 퍼포먼스급이 없는 대신 메인스트림의 A 시리즈 APU와 엔트리급의 카비니 기반 솔루션으로 나뉜다. 카비니를 제외하고 보면 사실상 애슬론은 최하위 프로세서 라인업이라고 봐도 무방하며 실제로도 FX 대비 구성 모듈 수가 적거나(FX는 최대 4모듈까지, 애슬론은 2모듈이 한계) L3 캐시가 없는 등(FX 4350 이상은 8MB, 4300이하는 4MB의 L3 캐시를 탑재한 반면 APU 및 애슬론은 L3 캐시가 없다) 성능상 뚜렷한 제약사항을 안고 있다. 오늘날 AMD 라인업의 또다른 특징이라면, 이들 구분에 따른 모든 세그먼트 하나하나가 제각기 다른 플랫폼을 사용하고 있다는 점이다.
이 점은 연내 AM4 플랫폼으로의 통합을 통해 해결할 것을 천명하고 있다. 현재도 부분적으로는 APU 라인업의 플랫폼 융합이 진행 중이어서, 모바일 시장에서 A 시리즈 APU의 후계자인 카리조와 카비니의 후계자인 카리조-L은 핀 호환성을 갖게 되었다. AM4는 여기에 '차세대 FX 후계자'까지 핀 호환성을 부여한 개념으로 생각하면 이해하기 편할 것이다.
AM4의 등장이 예고된 이상 현행 플랫폼에 어떤 변화를 주든 레임덕을 피할 수 없을 것이지만 AMD는 지난달 AM3 메인보드를 리뉴얼한 데 이어 FM2 플랫폼까지 새 바람을 불어넣었다. PCI-Express 라인 컨트롤러가 바뀌지 않은 탓에(AM3 에서는 900 시리즈 노스브릿지가, FM2 에서는 APU 내부에 탑재된 컨트롤러가 그 역할을 한다) PCI-E 3.0 등을 지원하는 등 획기적인 변화가 가해지지는 않았지만, USB 3.1이나 M.2 등 최신 I/O 인터페이스를 지원하게 되어 적어도 외견적으로는 세련된 최신 주변기기를 사용하는 PC를 구축할 수 있게 되었다는 데 의미를 부여할 수 있다.
드디어 오늘의 메인 요리가 등장했으니 바로 A10-7860K이다. (단, 진히어로인 애슬론 X4 845는 좀 더 뒤에 나오는데다 APU 중에서도 이 제품이 최상급 신제품은 아니다. 어찌 보면 페이크 히어로-_-) 사양을 눈여겨보면 터보클럭이 직속 하위모델인 A10-7850K와 같고 베이스클럭은 오히려 100MHz 내려간 것을 캐치할 수 있을 것이다. 그렇다면 7840K나 7750K 등이 더 어울릴 법하지 않은가? 하지만 이는 APU를 너무 가벼이 본 것이다. 앞서 카베리의 런칭 당시 AMD가 APU를 어떻게 정의했는가를 생각하면 7860K의 위치가 매우 정확하다는 것을 알아챌 수 있을 것이다. 그것은 바로 GPU를 CPU와 대등한 코어로써 합산한다는 개념이다.
|
A10-7870K |
A10-7860K |
A10-7850K |
A10-7800 |
A10-7700K |
CPU 코어 갯수 |
4 |
4 |
4 |
4 |
4 |
CPU 클럭 |
3.9 / 4.1 GHz |
3.6 / 4.0 GHz |
3.7 / 4.0 GHz |
3.5 / 3.9 GHz |
3.4 / 3.8 GHz |
GPU 컴퓨트 유닛 갯수 |
8 |
8 |
8 |
8 |
8 |
GPU 클럭 |
866 MHz |
757 MHz |
720 MHz |
720 MHz |
720 MHz |
CPU GPU 합산 연산성능 |
1012 GFLOPS (CPU 125 GPU 867) |
890 GFLOPS (CPU 115 GPU 775) |
856 GFLOPS (CPU 118 GPU 737) |
849 GFLOPS (CPU 112 GPU 737) |
846 GFLOPS (CPU 109 GPU 737) |
구체적으로 A10-7860K는 GPU 클럭이 7850K를 비롯한 여타 카베리 기반 A10 APU보다 소폭 상향되어 757MHz가 되어 있다. 지난 여름 출시된 A10-7870K보다는 낮은 클럭이지만 CPU GPU 합산으로 7850K보다 높은 부동소수점 연산성능을 제공하기는 충분해진 수치이다. 비단 이러한 논리로 AMD가 모델넘버를 결정했다는 사실보다도 더 중요한 것은, AMD가 내부적으로 제품을 테스트하는 벤치마크 포트폴리오에 대한 추측이 가능해졌다는 점에 있다.
이는 현재 객관적으로 보아 (GPU의 연산성능을 CPU에 합산해 쓸 수 있는) HSA의 저변이 넓지 않음에도 불구하고 내부적으로는 이미 GPU의 연산성능에 상당한 가중치를 부여하는 것으로 추정되기 때문이다. 또한 최초 카베리를 출시하던 2014년 1월과 비교하면 CPU의 비중은 13.8%에서 12.9%로 더욱 낮아졌다는 점에서, 내부적으로 이런 추세(CPU보다 GPU에 더욱 무게를 싣는)를 지향할 어떤 근거가 있다는 것으로밖에는 해석할 수 없기에 더욱 그렇다. 어쨌든 확실한 것은, AMD가 APU의 체급을 매김에 있어 가장 중요한 것이 해당 APU의 GPU 성능에 있다는 점이다.
한편, 진히어로 격인 A10-7890K의 사양은 정확히 공개되지 않았지만 외신의 보도로 미뤄볼 때 CPU 베이스클럭 4.0GHz / 터보클럭 4.3GHz, GPU 클럭 900MHz가 될 것이 유력시된다. 이 사양이 맞다는 것을 전제로 CPU GPU 합산 연산성능을 추정해보면 약 1050 GFLOPS 정도의 연산성능을 얻으며, A10-7870K 이래로 두 번째의 '테라플롭스급' 프로세서가 된다.
A10-7890/7860K 이외에 새로 추가된 것들은 위 표의 A6-7470K와 애슬론 X4 845이다. 7470K의 경우 이 글에서 기존의 A6 라인업과 일대일 비교하는 것은 생략할 것이지만, 이 역시 7860K가 그러했듯 기존의 인접 라인업 대비 상향된 GPU 클럭을 갖고 있어 결과적으로 더 향상된 연산성능을 얻게 된 모델이다. 기본적으로 동일한 기조의 연장선상에 있는 제품이라고 할 수 있다. 위 표에서 진정 주목해야 할 것은 역시 애슬론 X4 845이다.
라인업이 중상급에도 못 끼는 애슬론인 만큼 여러 핸디캡이 있는데 그 중 하나는 PCI-Express 라인 갯수가 16개에서 8개로 줄어든 것이다. 이외에도 내장그래픽 없는 독립 CPU로서 TDP가 여타 APU와 동일하다는 것은 기본적으로 실리콘 자체가 애초 CPU로서가 아닌 APU로서 설계된 것의 한계일 수도 있지만(내장그래픽이 비활성화되었더라도 누설전류를 무시할 수 없다), 데스크탑화가 아예 무산될 뻔했던 엑스카베이터 아키텍처 자체의 핸디캡으로도 볼 수 있을 것이다. (카베리와 동일한 공정에 트랜지스터 집적도를 30%가량 끌어올리다 보니 데스크탑 CPU로 사용할 수 있을만한 고클럭대에서는 소비전력이 치솟았다는 초기의 분석들을 상기하자. 노트북으로만 투입되었던 것은 이 때문.)
또한 L2 캐시 용량 역시 스팀롤러 아키텍처 기반의 APU들이 4MB를 탑재하고 있는 것과 비교해 2MB로 줄어 나름의 핸디캡으로 볼 소지도 있다. 다만 노트북용 엑스카베이터에서도 (이쪽에서는 A 시리즈 APU 및 FX까지 전 라인업이 출시되었다) L2 캐시가 동일하게 2MB인 것으로 보아, 이는 핸디캡이 아니라 기본 설계 자체가 '모듈당 1MB씩의 L2 캐시'로 변경된 것일 가능성이 더 높다. 여기에 무게를 싣는 이유는 엑스카베이터의 L1 캐시 용량이 스팀롤러보다 25% 더 증가되었기 때문이다. (구체적으로 L1 명령어 캐시가 64KB에서 96KB로 50% 증가되었다.) 다만, 아키텍처에 관한 디테일한 사항은 IYD & ITCM에서 이번달 중 국내 최초로 공개할 엑스카베이터 리뷰에서 다루는 것으로 하고 이 글에서는 생략하도록 한다.
지금까지 살펴본 내용을 요약해 보자. AMD는 지난주 3종의 APU와 1종의 CPU(그 중 도합 3종의 프로세서만 공식적으로 공개되었지만)를 정식 출시했으며 이들 중에는 데스크탑 프로세서로서 사상 두 번째로 1테라플롭스를 돌파한 것이자 현존하는 최고의 연산성능을 갖는 A10-7890K, 최후의 모듈 아키텍처로 Zen 이전까지 AMD 데스크탑 라인업의 씬 스틸러 역할을 맡게 될 애슬론 X4 845가 포함되었다.
특히 엑스카베이터의 성능은 앞서 AMD가 Zen의 성능을 죄다 '엑스카베이터 대비 몇%'로 발표함에 따라 향후 출시될 Zen의 청사진을 그려볼 수 있다는 점에서도 큰 주목을 받게 될 것이다. 이 역시, 해 뜨기 전이 가장 어둡다는 말이 있듯 현재 누구도 Zen의 구체적인 성능을 짐작조차 못 하는 답답한 상황이 조만간 종식되리라는 것으로 비유할 수 있지 않을까. 이에 관해 IYD & ITCM에서 국내 최초 공개를 목표로 엑스카베이터 리뷰를 준비하고 있으며 작업이 완료되는 한 누구보다 빨리 독자 여러분께 공개할 것이라는 약속을 전하며 글을 맺는다. 많은 기대와 관심 부탁드린다.
'컴퓨터 관련 소식' 카테고리의 다른 글
을의 반란에 대처하는 갑의 자세 : 인텔과 AMD의 서로 다른 대응 (0) | 2016.02.17 |
---|---|
시게이트, 소비자용 8TB / 엔터프라이즈용 10TB 하드디스크 출시 (1) | 2016.02.12 |
인텔 스카이레이크 Non-K 오버클럭 가이드 & BIOS 다운로드 (0) | 2016.02.05 |
인텔 스카이레이크 Non-K 오버클럭킹 - GIGABYTE(제이씨현) (0) | 2016.02.02 |
IYD 리포트 : PC 컴포넌트 & 빌드 가이드 (2016년 1월호) (0) | 2016.02.02 |