Filter
Exclude
Time range
-
Near
🧩 구글이 TPU 역사상 처음으로 학습과 추론을 완전히 분리한 8세대 칩을 발표했다. 🔸브로드컴이 학습칩을, 🔸미디어텍이 추론칩을 설계하고, 🔸마벨과는 차세대 추론 전용 칩까지 개발 중이다. 하이퍼스케일러가 엔비디아 의존에서 벗어나 자체 실리콘 주권을 확보하는 구조적 전환이 본격화되고 있다. 🤖 핵심 동인은 AI 에이전트다. 에이전트는 단순한 일회성 응답이 아니라 반복적이고 다단계적인 추론을 수행하므로, 추론 컴퓨팅 수요가 학습을 압도하는 구간에 진입했다. 추론이 전체 AI 컴퓨팅의 3분의 2를 차지하는 시대에, 범용 GPU가 아닌 워크로드 특화 칩이 비용 효율의 새로운 기준이 된다. 💡 이 변화의 수혜 체인은 명확하다. 커스텀 ASIC 매출이 GPU 출하 성장률의 3배 속도로 확대되고 있고, 세대마다 HBM 탑재량이 구조적으로 늘어나고 있다. 칩 설계의 다변화는 반도체 공급망 전체에 걸친 구조적 수요 확대를 의미한다. #GoogleTPUv8 #AI추론시대 #CustomASIC #HBM구조적수요 #InferenceComputing theinformation.com/briefings…
1
2
273
27 Oct 2024
Thrilled to see @aidangomez, @vipulved @ajratner, and team team/colleagues pushing the boundaries of AI! Their latest insights are shaping the future of inference computing. 🚀 #AI #InferenceComputing #Innovation
1
2
5
835