TECH

M1 울트라와 맥 프로에 대한 천기누설

안녕하세요. IT 칼럼니스트 최호섭입니다. 얼마 전 애플이 새롭게 공개한 M1 울트라 프로세서, 그리고 맥 스튜디오 어떻게 보셨나요? 놀라신 분들도 계실...
안녕하세요. IT 칼럼니스트 최호섭입니다. 얼마 전 애플이 새롭게 공개한 M1 울트라 프로세서,…

2022. 03. 18

안녕하세요. IT 칼럼니스트 최호섭입니다. 얼마 전 애플이 새롭게 공개한 M1 울트라 프로세서, 그리고 맥 스튜디오 어떻게 보셨나요? 놀라신 분들도 계실 테고, ‘나와는 관계 없다’는 분도 계실 겁니다. 저도 이 두 가지 감정이 섞여 있는 상황입니다. 하지만 적어도 맥으로 시간이 걸리는 일을 하시는 분들은 눈이 휘둥그레지셨을 겁니다. 저도 사실 그 정도까지의 성능은 전혀 필요가 없는데, M1과 M1 맥스를 경험해 봤고, 그에 비해 2배, 8배까지 빠르다고 하니 상상이 되기도 하고, 안 되기도 합니다.

https___events-delivery.apple.com_1402uekefjejgldkvaqrqxgjmtehwhez_m3u8_main.m3u8 - 25.54.884

그런데 애플이 신제품 공개 행사 말미에 “아직 맥 프로가 남았다”고 말했죠. 맥 프로는 늘 가격과 관계 없이 최고의 성능을 뽑아낼 수 있는 말 그대로 명확히 ‘프로를 위한 워크스테이션’입니다. 이미 맥 스튜디오가 지금 나와 있는 맥 프로의 성능을 뛰어 넘는다고 했으니 맥 프로에 대한 기대가 더 커지고 있습니다.

그래서 이번 글에서는 과연 맥 프로가 어떻게 나올지 아무런 사실도, 근거도 없이 자유롭게 상상을 해보려고 합니다. 아님 말고요.

‘칩 두 개를 잇다’의 의미

일단 애플이 M1 프로세서를 어떻게 또 ‘마개조’했는지 부터 생각을 해 봅시다. M1 울트라의 구조를 아주 간단하게 보면 M1 맥스의 다이(die)를 두 개 이어 붙인 겁니다. 물리적으로 두 배가 되며 M1 맥스의 두 배 가까운 성능을 내는 것이죠.

https___events-delivery.apple.com_1402uekefjejgldkvaqrqxgjmtehwhez_m3u8_main.m3u8 - 18.38.011

그럼 맥 스튜디오는 이 칩을 어떻게 인식할까요? M1 맥스 두 개로 볼까요? 그렇지는 않습니다. 흔히 서버에서 볼 수 있는 멀티 소켓 구조와는 다릅니다. 두 개의 M1 맥스 다이가 하나로 붙고, 그걸 다시 하나의 칩으로 패키징하기 때문에 구조적으로도 하나의 프로세서이고 맥에서도, 또 응용 프로그램들도 이를 구분해서 바라보지 않습니다. 하나의 20 코어, 64 GPU, 128GB 메모리로 인식합니다.

그래서 운영체제나 앱이 직접 일을 이쪽 M1 맥스 다이, 혹은 저쪽 M1 맥스 다이로 나눠주지 않아도 알아서 잘 나눠서 처리하게 됩니다. 물론 이게 완전히 하나의 반도체 회로로 만들어진 게 아니기 때문에 옆집 M1 맥스와 같이 일을 하려면 데이터를 싸짊어지고 왔다갔다 해야 하는 경우가 생기긴 합니다. 하지만 그 최적화는 칩 안에서 스케줄러가 가장 최적의 답을 찾아서 해 줍니다. 그러니까 앱 개발자들도 이 칩에 맞춰서 따로 최적화를 할 필요 없이 그냥 M1이랑 똑같이 쓰면 되는 거죠.

https___events-delivery.apple.com_1402uekefjejgldkvaqrqxgjmtehwhez_m3u8_main.m3u8 - 16.59.702

이렇게 다이 두 개를 하나처럼 쓰기 위해서는 단순히 ‘붙어있으니까 하나야!’가 아니라 실제로도 하나처럼 움직여야 합니다. 그 핵심은 두 칩을 잇는 ‘울트라 퓨전’이 넉넉하게 데이터를 주고 받을 수 있는 길을 터놓았기 때문인데요. 이 울트라 퓨전처럼 다른 컴퓨터, 혹은 CPU, 혹은 코어를 연결하는 것을 ‘패브릭’이라고 합니다. 패브릭은 원래는 서버를 연결할 때 쓰는 말인데, 이제는 이게 CPU 안으로도 들어와 있습니다. 인텔도, AMD도 이 패브릭을 적극적으로 이용해서 프로세서를 설계합니다.

그런데 이 패브릭은 일단 비쌉니다. CPU 속에 들어있는 캐시 메모리가 비싼 것처럼 말이죠. 그래서 사실 대부분 이렇게까지 성능을 높여놓지는 않습니다. 버벅거리지 않을 정도로만 길을 터 놓고, 그 와중에도 병목 현상이 일어나는 경우도 흔치 않습니다.

그런데 M1 울트라는 1초에 2.5TB를 주고받을 수 있도록 그 성능을 아주 높여 두었습니다. 애플도 지금 나와 있는 다른 패브릭에 비해 2배 이상 빠르다고 밝혔고요. 아주 무식하게 계산해서, M1 맥스의 다이끼리 64GB 메모리를 통째로 1초에 39번을 복사할 수 있는 속도입니다. 이 패브릭 속도는 단순히 두 개 M1 맥스 다이 사이에 병목을 줄이는 것 이상의 무엇인가가 숨어 있는 게 아닌가 하는 생각이 드는 거죠.

M1 울트라의 짠돌이 전력 관리법

M1 울트라의 전력 관리도 조금 살펴볼까요. 이 맥 스튜디오가 항상 20개 코어, 64개 GPU를 100% 쓰지는 않겠죠. 때로는 어느 정도 여유있는 일들이 돌아간다고 생각해 봅시다. 그게 절반, 그러니까 딱 한 쪽 M1 맥스 다이로 다 처리할 수 있을 정도라면 이 칩은 어떻게 작동을 할까요? 이론적으로는 아예 한쪽 M1 맥스 다이를 꺼버리면 전기를 엄청 적게 쓰겠죠? 실제로 그럴까요?

네, 좀 싱겁지만 그렇습니다. 그런데 이게 단순하게 다이 단위로 나뉘는 건 아닙니다. 애초에 M1 프로세서의 기본 구조 자체가 그 안에 들어있는 CPU나 GPU가 코어별로 전력 관리가 됩니다. 왜냐면 이 칩의 뿌리가 바로 전력 관리에 예민한 아이폰에서 시작했기 때문이죠. A15 바이오닉 칩도, 심지어 A9 칩도 이렇게 움직입니다.

https___events-delivery.apple.com_1402uekefjejgldkvaqrqxgjmtehwhez_m3u8_main.m3u8 - 16.49.050

그래서 아주 가벼운 일은 고효율 코어로 처리하고 쓰지 않는 나머지는 다 꺼버리는 겁니다. 그러다가 고효율 코어로 버겁다면 바로 고성능 코어를 하나 둘씩 켜서 일을 그쪽으로 돌립니다. 일하던 건 메모리에 있으니까 데이터를 옮길 필요 없이 자리를 다른 코어에게 내주는 거죠. 그리고 필요하면 같이 거들기도 합니다.

그러니까 안 쓰는 코어들을 적절하게 끄고 켜고 하는 건데, 다시 처음의 이야기로 돌아가서 절반 만큼의 일이 주어진 상황을 봅시다. 한쪽 다이에서만 일을 다 할 수 있다면 반대쪽 다이의 코어들은 저전력 정책에 따라서 안 켜지겠죠. 그러다가 일이 조금씩 늘어나면 필요에 따라서 한개씩 켭니다.

그러면서 열과 전력 소비량을 조정해 나갑니다. 그리고 이런 것들이 앱 개발자들이나 이용자들이 신경 쓸 필요 없이 매끄럽게 이뤄집니다. 안 써봤는데 어떻게 아냐고요? 왜냐면 M1이나 M1 맥스가 그랬고요, 이 M1 울트라는 맥스 2개니까요. 이게 진짜 이 설계의 무서운 점입니다. 안 써봤지만 어떤 맛인지 구입 예정자들이 정확히 알게 되는 거죠.

그리고 재미있는 건 이런 전력 관리 정책이 CPU 뿐 아니라 GPU, 뉴럴 엔진, 등에도 모두 적용됩니다. 그래서 2번째 M1 맥스 다이의 CPU와 GPU는 모두 끄고 메모리만 켜서 쓸 수도 있어요. 또는 GPU만, CPU만 따로 가져다가 쓸 수도 있는 거죠.

지금 내가 다음 M1 칩의 설계도를 그린다면…

https___events-delivery.apple.com_1402uekefjejgldkvaqrqxgjmtehwhez_m3u8_main.m3u8 - 17.58.958

자, 그래서 이런 걸 바탕으로 다음 칩을 대충 짚어볼 수 있어요. 바로 괴물 컴퓨터 ‘맥 프로’에 들어갈 칩이죠. 네, 말 그대로 그냥 짚어보는 겁니다. 아직 어떤 칩이 나올 것이라는 정보도 없고, M1 울트라 이후의 칩이 없을 수도 있어요. 이걸 두 개, 네 개 소켓으로 이어 붙이는 단순한 결과물이 나올 수도 있고요. 하지만 재미로 상상을 해 봅니다.

제 상상의 핵심은 M1 맥스 두 개를 연결한 패브릭을 확장하는 겁니다. 지금은 칩 두 개를 바로 맞붙이게 되어 있지만 이걸 브릿지처럼 설계해서 4개를 이어 붙일 있을지도 몰라요. 괜찮을지 모르겠지만 8개도 안 될 건 없을 것 같습니다. 다만 다이를 여러개 이어 붙이면 붙일수록 칩 사이의 거리가 물리적 거리가 너무 멀어져서 4배, 8배 성능이 나오지 않을 수 있지만 그렇게라도 코어를 연결하는 게 더 높은 성능을 낸다면 생각하지 못할 구조는 아닙니다.

https___events-delivery.apple.com_1402uekefjejgldkvaqrqxgjmtehwhez_m3u8_main.m3u8 - 14.54.712

칩 설계 비용에 비해서 시장이 작은 것 아니냐고 할 수도 있는데, 높은 성능만 낸다면 더 많은 일을 할 수 있기 때문에 비싼 기기에도 투자를 아끼지 않는 맥 프로의 시장에서는 충분히 시도해볼 수 있습니다. 더구나 그 기본 구조는 M1 맥스라는 단위 덩어리가 있기 때문에 이걸 잘 연결하기만 하면 그렇게까지 터무니 없는 개발, 생산 비용이 들지도 않을 겁니다.

그리고 이쯤에서 조심스럽게 이름을 점찍어 보자면 기본적으로는 M1 울트라와 비슷한 구조이기 때문에 브랜드를 따로 만들기 보다는 M1 맥스의 개수에 따라서 M1 울트라4, M1 울트라6, M1 울트라8 처럼 지을 수도 있을 것 같습니다. 패브릭으로 연결된다는 M1 울트라의 정체성을 유지하면서도 얼마나 더 높은 성능인지 단 번에 알 수 있습니다. M1 맥스의 4배, 8배, 16배 성능이 나온다는 거죠.

자, 이쯤에서 상상의 나래를 더 펼쳐 봅시다. 이건 맥 프로의 확장성과도 연결이 됩니다. 이 패브릭은 M1 맥스 다이와 다이를 연결하기 때문에 꼭 CPU 끼리만 정보를 주고 받는 것은 아닙니다. 데이터까 오가는 물리적인 시간을 어느 정도 감안하더라도 GPU나 뉴럴 엔진을 잔뜩 달아서 한꺼번에 많은 데이터를 처리하는 병렬 컴퓨팅이 필요한 경우에는 이 프로세서의 구조를 살짝 손 봐서 성능 확장 카드를 만들 수도 있을 것 같습니다.

앞서 이야기했던 전력 관리를 떠올려 보세요. M1 울트라는 M1 맥스의 한쪽이 필요 없어서 꺼 두었다가도, 필요한 순간에는 메모리만 켜서 쓸 수도 있습니다. 물론 GPU나 CPU도 마찬가지지요. 그래서 만약에 애플이 이 칩의 CPU 부분을 싹 지우고, 그 안에 GPU와 메모리를 잔뜩 집어 넣은 칩을 만들 수도 있을 겁니다. 그러면 그게 바로 그래픽카드죠. 물론 이건 통합 메모리라는 기본 틀에서는 벗어나지만 패브릭의 성능이 충분하고, 병렬 처리가 다른 무엇보다 중요한 작업이라면 충분히 성능을 끌어올릴 수 있는 방법입니다.

https___events-delivery.apple.com_1402uekefjejgldkvaqrqxgjmtehwhez_m3u8_main.m3u8 - 33.29.566

맥 프로는 단순히 성능이 높은 컴퓨터가 아니라 필요에 따라서 메모리도, 저장장치도 또 그래픽카드도 닥치는 대로 연결할 수 있는 것이 특징입니다. 쓰면서도 계속 확장을 해 나가는 모듈형 구조죠. 하지만 현재 M1 프로세서는 바로 그 확장성에서는 한계가 있습니다. GPU와 메모리를 한 칩에 넣어야 하기 때문이죠. 하지만 외부로 연결되는 고속도로가 있다면 이를 활용할 수 있을 수도 있습니다. 그렇다면 GPU를 더 많이 꽂거나, 뉴럴 엔진을 잔뜩 넣는 것도 가능할 겁니다. 성능은 맥 스튜디오와 비교할 수 없을 만큼 높아질 테고, 필요하면 그마저도 더 늘릴 수 있는 거죠.

물론 상상만일 수도 있긴 해요. 니가 해봐라 하면 할 말은 없습니다. 하지만 기술적으로는 충분히 상상해볼 수 있는 일일 겁니다. 이 M1은 애초에 우리가 잘 알고 있는 CPU와 메모리를 중심으로 한 ‘폰 노이만 방식’의 컴퓨터를 다시 해석한 통합 메모리 중심의 프로세서로 설계가 되었습니다. 그 메모리를 중심으로 여러 칩들이 매끄럽게 연결된다면 성능이 별다른 걸림돌 없이 쭉쭉 올라가게 됩니다. 애플의 상상력은 아마 더 놀라운 제품을 내놓을 수도 있습니다.

https___events-delivery.apple.com_1402uekefjejgldkvaqrqxgjmtehwhez_m3u8_main.m3u8 - 27.44.014

애플이 모든 맥의 라인업을 자체 반도체로 처리하겠다고 한 게 바로 2020년 6월 WWDC입니다. 그리고 2년 동안 모든 맥의 전환이 이뤄질 것이라고 이야기했으니 딱 2년이 되는 날 그 마지막을 장식할 맥 프로용 반도체가 나오지 않을까 기대해 봅니다. 2년이 팬데믹과 함께 어떻게 지나갔는지 어리둥절하지만 저 개인적으로는 세상 밖의 그 답답함 대신 이 작은 칩에 대한  여러가지 상상으로 즐거운 경험이었습니다. 반도체의 발전은 이제 정점에 다다랐나 싶을 때마다 다시 큰 변화를 제시합니다. 반도체의 변화는 분명 ‘이러면 될까?’라는 아이디어에서 시작했습니다. 여러분도 애플이 다음에 꺼내 놓을 프로세서를 한번 상상해 보는 건 어떨까요.

About Author
최호섭

지하철을 오래 타면서 만지작거리기 시작한 모바일 기기들이 평생 일이 된 IT 글쟁이입니다. 모든 기술은 결국 하나로 통한다는 걸 뒤늦게 깨닫고, 공부하면서 나누는 재미로 키보드를 두드립니다.