AI 기술의 진화: AMD, AI 훈련 분야에서 NVIDIA와 경쟁하다
지난 몇 년간 AMD와 NVIDIA의 경쟁은 IT 업계의 뜨거운 이슈였습니다. 특히 AI 기술의 발전과 함께 이 두 회사의 경쟁은 더욱 심화되고 있습니다. 오늘 블로그에서는 AMD의 최근 움직임과 그 배경에 대해 알아보고자 합니다.
1부: TensorWave, AMD의 신데렐라 스토리
AMD는 2023년 MI300X를 발표하며 AI 시장에서 NVIDIA에 도전장을 던졌습니다. 이 GPU는 NVIDIA의 H100보다 30% 높은 성능을 자랑하며, 메모리 용량도 두 배 이상이며 대역폭은 60%나 더 높다고 합니다. 그럼에도 불구하고, 이 칩은 시장에서 기대만큼의 반응을 얻지 못했습니다. 이에 대해 TensorWave의 CEO 다릭 호튼은 "AMD의 하드웨어는 훌륭하지만 초기 소프트웨어 지원이 부족했다"고 평가했습니다. 실제로 초기에는 훈련 성능이 인퍼런스(추론)와 비교해 부족했지만, 지난 16개월 동안 소프트웨어가 크게 개선되었습니다.
2부: 차세대 AI 훈련과의 대면
AI 훈련은 지속적으로 관련성을 유지할 것입니다. 특히 새로운 방법론과 AI 아키텍처의 근본적인 변화가 계속될 것이라고 호튼은 전망합니다. AMD는 이러한 변화에 맞춰 TensorWave와 함께 대규모 AI 훈련 클러스터를 구축 중입니다. 이 훈련 클러스터는 8,192개의 MI325X GPU로 구성되어 있으며, 42 엑사플롭의 FP8 연산 성능을 제공할 예정입니다. 또한, 이미 이전 세대 대비 성능이 향상된 MI325X는 향후 시장에서 큰 주목을 받을 것으로 보입니다.
3부: 효율적인 냉각 기술과 미래 전망
AMD의 AI 칩셋은 효율적인 성능 발휘를 위해 액체 냉각 기술을 채택하였습니다. 이는 차세대 GPU의 발열 문제를 해결하기 위한 방법으로 주목받고 있습니다. 호튼은 "공랭 방식도 가능하지만, 장기적으로 성능을 포기하는 것과 같다"고 강조하며, 액체 냉각 기술의 중요성을 언급했습니다.
결론: AI 생태계의 변화 속에서의 AMD의 위치
AI 생태계는 매일 빠르게 변화하고 있으며, AMD는 이러한 변화 속에서 중요한 역할을 하려 하고 있습니다. 특히 대기업들과의 협력 및 대규모 프로젝트를 통해 시장에서 점유율을 높이고 있습니다. 이와 같은 전략은 NVIDIA와의 경쟁에서 그들의 입지를 더욱 탄탄히 다질 것으로 예상됩니다.
무엇보다도, AMD의 이러한 전략은 AI와 하드웨어의 관계에 대한 새로운 인사이트를 제공합니다. 앞으로의 기술 발전이 더욱 기대가 됩니다.
블로그 작성자가 말했다시피, AI 시장에서의 변화는 항상 예측 가능하지 않습니다. 하지만 AMD의 노력과 도전이란 언제나 환영받을 것입니다. 여러분의 생각은 어떠신가요? 댓글로 여러분의 의견을 공유해 주세요!