Model Bahasa Besar (LLM) AI Chinese untuk Local Run (Self-Hosting)
Ini poin paling penting buat kamu yg tanya "yg bisa locally":
1. Kimi 2.7-Code:
- Bisa di HF dengan vLLM/Ollama.
- MoE efisien (32B active), tapi butuh GPU kuat (minimal 2–4x H100 atau quantisasi berat untuk consumer).
- Native INT4 quantization membantu.
- Cocok untuk coding agent lokal jangka panjang.
2. Qwen 3.6:
- Paling ramah local.
- 27B dense: Bisa di 18–24 GB VRAM (RTX 4090/3090 ).
- 35B-A3B MoE: ~22–30 GB.
- Unsloth/vLLM support bagus, cepat fine-tune.
- Pilihan terbaik untuk hardware consumer/ mid-range.
3. DeepSeek V4:
- Flash: ~142–160 GB weights (quant FP4/FP8), butuh 2–4x H100 atau multi-GPU workstation.
- Bisa di consumer dgn quant berat tapi lambat.
Pro: Raksasa (800 GB), hanya data center (8–16x H100).
- Flash lebih realistis untuk local.
Rekomendasi Local model LLM Chinese:
- Hardware terbatas (1x RTX 4090 atau <40 GB VRAM) → Qwen 3.6 27B/35B.
- Punya multi-GPU dan butuh reasoning panjang → DeepSeek V4 Flash.
- Fokus coding agent/swarm & vision → Kimi 2.7 (kalau hardware mendukung).
Rekomendasi Use Case
- Coding Agent & Long-Horizon Task: Kimi 2.7 menang (efisien thinking, swarm agent, instruksi reliable).
- Value & Reasoning/Math: DeepSeek V4 Flash (context keren bgt, harga murah).
- Local/Efisiensi Sehari2 dan Multilingual: Qwen 3.6 (paling mudah dijalankan, stabil).
- Semua kompetitif dgn Western frontier (Claude/GPT) di niche masing2, tapi jauh lebih murah/open.
Membuat personalized AI semacam yg tadi di tweet utama atau YoUniverseAI saya, banyak bagiannya benar2 free juga open source.
- Hermes Agent (open source)
- Obsidian (gratis)
- Gbrain (dari Garry Tan / CEO Y Combinator) juga open source di GitHub
Ini bkn hanya chat AI biasa, tapi Personal AI Agent Second Brain yg benar2 bisa dipakai sehari2 di kantor untuk:
- Menyiapkan data dan laporan
- Review meeting dan catatan
- Bantu membuat presentasi/dokumen
- Mengingat semua keputusan dan proyek lama
- Kerja lebih cepat tanpa harus mengulang2 menjelaskan konteks
Setup:
- Install: Obsidian, Hermes, GBrain
- Browsing struktur Folder Vault Obsidian
- Setup Hermes Memori
- Integrasi GBrain
- Browsing workflow nya
Kalau mau pakai lokal full bisa pakai Ollama Hermes Obsidian Gbrain lokal.