<잠깐 지식 나눔 >
자율주행의 알고리즘 아키텍처는 AI 기술의 발전 속도와 긴밀히 연결되어 있으며, 최근 3~4년간 큰 변화를 겪고 있습니다.
테슬라는 업계에서 가장 앞선 벤치마크로, 2021년 BEV 트랜스포머 구조를 상용화했고, 2024년 FSD V12.3에서 대형 모델 기반 엔드투엔드(End-to-End) 아키텍처로 전환했습니다.
이 접근법은 기존의 복잡한 모듈식 파이프라인을 단순화하면서, 지연(latency)과 오차(error)를 줄이고, 전체 시스템의 정확성과 효율성을 동시에 개선하는 효과를 보여주었습니다.
업계 전반적으로는 부분적 엔드투엔드(Perception E2E, Planning E2E 등)에서 출발해, 궁극적으로 OneModel 형태의 완전한 엔드투엔드 자율주행을 실현하는 방향으로 발전하고 있습니다.
이를 뒷받침하기 위해 최근에는 언어모델(VLM)이나 멀티모달 모델(VLA)을 결합하는 연구가 빠르게 확산되고 있습니다.
예를 들어, 리오토(Li Auto)는 2024년 7월에 VLM을 차량 칩에 직접 배치한 엔드투엔드 VLM 시스템을 출시했고, 2025년에는 MindVLA라는 차세대 지능형 주행 솔루션을 엔비디아 GTC에서 발표했습니다.
샤오펑(Xpeng)은 G7 모델에 업계 최초로 VLA VLM 대형 모델을 탑재했으며, “운동형 뇌 소뇌” 구조로 불리는 VLA-OL 모델을 통해 지속학습(continual learning) 기능까지 강화하고 있습니다.
또한, 테슬라·니오·리오토 등은 모두 세계 모델(World Model)의 개념을 병행 도입하고 있습니다.
세계 모델은 두 가지 방식으로 해석됩니다.
1.데이터 생성기로서: 클라우드에서 합성 데이터를 만들어 엔드투엔드 모델의 시뮬레이션 학습을 지원
2.원모델 확장으로서: 미세 조정(fine-tuning)과 모듈 확장을 통해 자율주행을 직접 구현하며 비즈니스 영역 까지 확장
이처럼 업계는 엔드투엔드·세계 모델·멀티모달 AI를 점진적이면서도 상호 협력적으로 융합하고 있으며, 이는 기존 하드웨어 기반 시스템보다 더 안전하고 효율적인 자율주행 구현을 가능하게 하는 방향으로 진화하고 있습니다.