Tương lai của robot không nằm ở phòng thí nghiệm, nó nằm trên trình duyệt của bạn.
Đã qua rồi cái thời việc huấn luyện robot chỉ giới hạn trong các phòng lab đắt đỏ với thiết bị chuyên dụng. Với
@axisrobotics, toàn bộ quy trình này được gói gọn vào một kiến trúc 4 lớp (L1 đến L4) mạnh mẽ, kết nối con người và AI ngay trên trình duyệt web,. Cùng bóc tách cách "cỗ máy" này hoạt động!
1/ Lớp 1 (L1) — World Generation (Xây dựng thế giới ảo) Để AI học cách tương tác với thế giới, nó cần một môi trường. Chỉ từ những câu lệnh ngôn ngữ tự nhiên đơn giản (như "nhặt món đồ chơi"), L1 sẽ tự động sinh ra các môi trường mô phỏng hoàn chỉnh. Lớp này sử dụng ngôn ngữ MetaSim để lấy dữ liệu từ thư viện hơn 2.000 vật thể 3D, từ đó sắp xếp bố cục, cài đặt tính chất vật lý và xuất ra các định dạng tương thích với mọi loại giả lập.
2/ Lớp 2 (L2) — Behavior Collection (Thu thập dữ liệu trên trình duyệt) Đây là lúc bạn tham gia! L2 sẽ đặt bạn vào thế giới ảo của L1 để điều khiển robot hoàn thành nhiệm vụ. Điểm kỳ diệu là nền tảng này sử dụng MuJoCo WASM, cho phép chạy giả lập vật lý trực tiếp trên trình duyệt web máy tính. Bạn không cần GPU hay cài đặt phần mềm, chỉ cần dùng bàn phím điều khiển cánh tay máy và mọi hành động của bạn sẽ được ghi lại thành các quỹ đạo (trajectories).
3/ Lớp 3 (L3) — Data Refinement (Tăng cường dữ liệu bằng GPU server) Làm sao để 1 hành động điều khiển của con người biến thành hàng ngàn bài học cho AI? Dữ liệu thô từ web sẽ được làm sạch (lọc lỗi, làm mượt) và đưa lên các máy chủ GPU chạy giả lập IsaacSim. Tại đây, hệ thống áp dụng kỹ thuật Domain Randomization, liên tục thay đổi góc camera, ánh sáng, vật liệu và trọng lượng vật thể, nhân bản thao tác của bạn thành hàng nghìn mẫu dữ liệu siêu thực.
4/ Lớp 4 (L4) — Model Training & Deployment (Huấn luyện mô hình AI) Lớp cuối cùng là nơi "bộ não" thực sự hình thành. Nguồn dữ liệu hoàn hảo từ L3 sẽ được sử dụng để huấn luyện các mô hình như Vision-Language-Action (VLA),. Các mô hình AI này không chỉ được đánh giá qua nhiều môi trường ảo mà còn được triển khai thực tế thành công lên phần cứng vật lý (như cánh tay máy Franka Research 3) với độ chính xác cao.
5/ Tổng kết: Với cấu trúc chia tách hoàn hảo: L1 tạo môi trường, L2 thu thập hành vi qua web, L3 tăng cường dữ liệu trên đám mây và L4 huấn luyện mô hình. AXIS đã giải quyết bài toán cốt lõi của Physical AI: thiếu hụt dữ liệu. Bạn có thể trở thành một phần của kỷ nguyên này bằng cách tự mình điều khiển robot và đóng góp dữ liệu ngay hôm nay.
@LihThooi @chris_anm01 @mintt_34 @irisle_growth