Filter
Exclude
Time range
-
Near
Odd One retweeted
2 Dec 2023
1時間のGLSLライブコーディングをしました! Shader Royale Jam (with liveact by Parallel Pulse) #inerciaparty #demoscene #livecode
1
32
156
11,445
Replying to @maigadohcrypto
I cant say you are wrong. Because it is changable how you work with ai. But generally ai is better in static progress. Audit contests generally have static structure. Because no livecode, no onchain dependancy
3
1
1,166
Weekly Q&A livestream/livecode on reproducible research workflows via R, RMarkdown and Quarto NOW LIVE!! Every Tuesday from 7-8(Eastern) come lend a hand as we promote single-platform project execution practices!! Tonight's feature exploration is code appendices - appendices with your scripting auto-filled as content!! Anything you'd like to see covered on future sessions? If so, drop a note here and I'll be happy to do so. youtube.com/watch?v=i66Jnjau…
1
1
32
Jun 9
Best models for your hardware this week. 8-12GB - huggingface.co/LiquidAI/LFM2… incredible model, so fast, so small 16-32GB - latest Google model, Gemma 12B: huggingface.co/google/gemma-… really solid performance up neck and neck with a model 2x its size from a month ago. Jetbrains new model, best in class on livecode bench 32-96gb - Nex-N2-Mini GPT style postrain of Qwen-35B it seems to be its class leader caveman style reasoning huggingface.co/nex-agi/Nex-N… - Jackrong’s Qwopus is the #1 overall Q4 of Qwen3.6-27B on our benchmark suite of 5 agent coding benchmarks (1200 samples total) huggingface.co/Jackrong/Qwop… 192gb - Step-3.7-Flash is hard to beat, high scores, really fast inference, vision capable, later cutoff dates huggingface.co/stepfun-ai/St… 384gb - Nex-N2-Pro GPT style post train of Qwen-3.5-397B incredibly strong and #1 on deepswe if their claims are right huggingface.co/nex-agi/Nex-N… 768gb - very promising post-train of GLM-5.1 that wins out on 8 benchmarks huggingface.co/mindlab-resea…
50
94
1,112
58,126
"Gemma 4 12B ให้ประสิทธิภาพใกล้เคียงกับโมเดล 26B MoE ที่ใหญ่กว่าบน benchmark มาตรฐาน แต่ใช้หน่วยความจำรวมไม่ถึงครึ่ง และไม่มี multimodal encoder อีกต่อไป เพราะ input ทั้งภาพและเสียงไหลตรงเข้าสู่ LLM backbone ได้เลย" 🔹 ทีมพัฒนา Gemma, Google DeepMind ═══════════════════ วันนี้ Google DeepMind เปิดตัว Gemma 4 12B โมเดล multimodal แบบเปิด (open model) ที่เป็น dense model พร้อมสถาปัตยกรรมแบบ unified และ encoder-free ประโยคเปิดข้างต้นสรุปหัวใจของเรื่องทั้งหมดไว้แล้ว นั่นคือโมเดลที่ทำคะแนนได้ใกล้เคียงรุ่นที่ใหญ่กว่าอย่าง 26B MoE บน benchmark มาตรฐาน แต่กลับใช้หน่วยความจำรวมไม่ถึงครึ่ง และเล็กพอจะรันบนเครื่องส่วนตัวที่มี VRAM หรือ unified memory เพียง 16GB ความกะทัดรัดนี้ส่วนหนึ่งมาจากการรื้อสถาปัตยกรรมแบบเดิมทิ้ง แล้วออกแบบใหม่ให้ไม่ต้องพึ่ง encoder แยกสำหรับภาพและเสียงอีกต่อไป Gemma 4 12B วางตัวอยู่ตรงกลางระหว่างสองรุ่นในตระกูลเดียวกัน คือ E4B ที่เน้นรันบน edge device และ 26B MoE (Mixture of Experts) ที่เป็นรุ่นความสามารถสูงกว่า ตัวมันเองเป็น decoder-only transformer ตัวเดียวที่ใช้โครงสร้าง decoder ขั้นสูงชุดเดียวกับ Gemma 4 31B Dense และยังเป็นโมเดลขนาดกลางรุ่นแรกของตระกูล Gemma ที่รองรับ audio input แบบ native อีกด้วย ทีมพัฒนาเล่าว่าตอนนี้โมเดลตระกูล Gemma 4 มียอดดาวน์โหลดทะลุ 150 ล้านครั้งแล้ว และนักพัฒนาได้นำไปสร้างสารพัดอย่างตั้งแต่แขนกลหุ่นยนต์แบบสวมใส่เพื่อช่วยเหลือทางกายภาพ ไปจนถึงระบบ AI security ระดับองค์กร ═══════════════════ 📌 จุดเด่นหลัก 🔹 สถาปัตยกรรมแบบ encoder-free ป้อนข้อมูล multimodal เข้าสู่ LLM backbone ได้โดยตรง ข้าม vision และ audio encoder หลายขั้นที่หนักอึ้ง จึงช่วยลด latency ของงาน multimodal ลง 🔹 เป็นโมเดลขนาดกลางรุ่นแรกของตระกูล Gemma ที่รับ audio input ได้แบบ native จากเดิมที่ความสามารถด้านเสียงถูกจำกัดอยู่แค่รุ่น edge ตัวเล็กอย่าง E4B 🔹 ขนาดเป็นมิตรกับนักพัฒนา รันบนแล็ปท็อปที่มี GPU พร้อม VRAM หรือ unified memory 16GB ได้ และทีมพัฒนายังปล่อยโมเดล multi-token prediction (MTP) แยกออกมาเพื่อเร่งความเร็ว local inference 🔹 เป็นครั้งแรกที่มีแอปพลิเคชัน desktop บน macOS ให้ดาวน์โหลด เปิดให้สัมผัสการโต้ตอบด้วยเสียงและภาพแบบ local เต็มรูปแบบบนเครื่องทั่วไป ═══════════════════ 🔧 สถาปัตยกรรมไร้ encoder ทำงานอย่างไร โดยปกติแล้วโมเดล multimodal จะอาศัย vision encoder และ audio encoder ที่แยกออกจากกันและถูก freeze เอาไว้ การที่ input ต้องวิ่งผ่าน encoder หลายตัวก่อนจะถึง LLM ทำให้เกิดทั้ง latency ที่สูงขึ้นและการใช้หน่วยความจำที่กระจัดกระจาย Gemma 4 12B แก้ปัญหานี้ด้วยการยุบรวมทุกอย่างไว้ใน transformer ตัวเดียว ลองเทียบไปป์ไลน์สองแบบให้เห็นภาพกัน ในแบบเดิม ภาพต้องผ่าน Vision Encoder ขนาด 550M parameters และเสียงต้องผ่าน Audio Encoder ราว 305M parameters ก่อนจะถูกแปลงเป็น token แล้วส่งเข้า LLM แต่ใน Gemma 4 12B ภาพผ่าน embedder ขนาดจิ๋วเพียง 35M parameters (แค่ 1 layer) ส่วนเสียงนั้น project เข้า LLM ได้โดยตรงโดยไม่มี encoder เลย กลไกเบื้องหลังแบ่งออกเป็นสองฝั่ง ฝั่งภาพ embedder ขนาด 35M เข้ามาแทนที่ vision transformer จำนวน 27 layer ที่ใช้ในรุ่นขนาดกลางตัวอื่น โดยรับ patch ภาพดิบขนาด 48x48 pixel แล้ว project เข้าสู่ hidden dimension ของ LLM ด้วยการคูณเมทริกซ์ (matmul) เพียงครั้งเดียว จากนั้นใช้ factorized coordinate lookup ซึ่งก็คือเมทริกซ์แกน X และแกน Y เพื่อแนบข้อมูลตำแหน่งเชิงพื้นที่เข้าไปกับ input โดยตรง ฝั่งเสียง ตัด audio encoder ออกทั้งหมด ข้าม conformer จำนวน 12 layer ที่เคยใช้ในรุ่น E2B และ E4B โดยหั่นสัญญาณเสียงดิบ 16 kHz ออกเป็น frame ละ 40ms (frame ละ 640 floats) แล้ว project แบบเชิงเส้นเข้าสู่ input space ของ LLM โดยตรง ═══════════════════ 🎛️ fine-tune ง่ายขึ้นเพราะใช้ weight ชุดเดียว เพราะภาพ เสียง และข้อความใช้ weight ชุดเดียวกันทั้งหมด เราจึงไม่ต้องมานั่ง co-tune encoder ที่ถูก freeze แยกกันหลายตัวอีกต่อไป ไม่ว่าจะทำ adapter อย่าง LoRA หรือ tune แบบเต็ม ก็จะอัปเดต token loop ของ multimodal ทั้งวงได้ในรอบเดียว และทำได้ผ่าน Hugging Face หรือ Unsloth นี่คือข้อได้เปรียบเชิงปฏิบัติที่สำคัญสำหรับคนที่อยากปรับแต่งโมเดลด้วยตัวเอง ═══════════════════ 📊 ผล benchmark ตามกราฟที่ทีมพัฒนาเผยแพร่ Gemma 4 12B ทำคะแนนได้ดังนี้ GPQA Diamond 78.8, BBEH 53, MMLU Pro 77.2, LiveCode Bench 72, DocVQA 94.9, InfoVQA 88.4, MMMU Pro 69.1 และ MRCR v2 8 needle 128k เฉลี่ย 43.4 โดยกราฟนี้วางเทียบกับ Gemma 3 27B รุ่นก่อนหน้า และ Gemma 4 26B รุ่นที่ใหญ่กว่า ภาพรวมที่เห็นคือ Gemma 4 12B ซึ่งเป็นรุ่นเล็กกว่า กลับทำได้สูสีกับรุ่น 26B และทิ้งห่าง Gemma 3 27B รุ่นก่อนในแทบทุกรายการ เป็นการตอกย้ำว่าการลดขนาดและตัด encoder ออกไปนั้นไม่ได้แลกมาด้วยความสามารถที่ลดลงเลย ═══════════════════ 🧠 ทำอะไรได้บ้าง Gemma 4 12B ทำได้หลากหลาย ทั้ง agentic reasoning, video understanding และการเขียนโค้ด โดยทีมพัฒนายกตัวอย่างการใช้งานจริงที่น่าสนใจมาสองชิ้น 🔹 ตัวอย่างแรก ทีมพัฒนาให้ Gemma 4 12B เขียนแอปพลิเคชันประมวลผลภาพขึ้นมาเอง โดย serve โมเดลบนเครื่องด้วย llama.cpp ร่วมกับ gemma-skills แล้วใช้มันเขียนแอป Gradio ที่ช่วยผู้ใช้ประมวลผลภาพ จุดที่น่าทึ่งคือแอปนั้นรันด้วยโมเดล Gemma 4 12B ตัวเดียวกับที่สร้างมันขึ้นมา และยังนำไปใช้ร่วมกับ agent harness อย่าง OpenCode ได้อีกด้วย 🔹 ตัวอย่างที่สอง ทีมพัฒนาป้อนวิดีโอความยาว 5 นาที (คลิปช่วงหนึ่งจากงาน Google I/O keynote) ที่สกัด frame มาที่ 1 FPS รวมทั้งหมด 313 frame พร้อมเสียงและ prompt เข้าไปพร้อมกัน เพื่อให้โมเดลตอบคำถามเกี่ยวกับเนื้อหาในคลิป สะท้อนความสามารถด้าน video understanding ที่รับได้ทั้งภาพต่อเนื่องและเสียงในรอบเดียว ═══════════════════ 💻 รันบนเครื่อง Mac และเปิดเป็น local API ได้ พร้อมกับการเปิดตัว ทีมพัฒนายังเปิดตัวการเชื่อมต่อแบบ on-device ที่ขับเคลื่อนด้วย LiteRT-LM เพื่อนำการประมวลผล AI แบบ local มาสู่เครื่อง desktop โดยตรง 🔹 ฝั่ง Mac นับเป็นครั้งแรกที่มีแอปพลิเคชัน desktop ให้ดาวน์โหลด โดย Google AI Edge Gallery ขยายจากมือถือมาสู่ desktop รัน Gemma 4 12B แบบ offline บน GPU ของ Apple Silicon ได้ และมาพร้อม sandbox สำหรับรันโค้ด Python ที่เขียน รัน และพล็อตกราฟทางวิทยาศาสตร์ได้ในหน้าต่างแชทเลย ส่วนแอป Google AI Edge Eloquent บน Mac ก็เปิดรองรับ Gemma 4 12B เพื่อขับเคลื่อนการสั่งงานด้วยเสียงแบบ Voice Edit 🔹 อีกทางเลือกหนึ่งคือรันเป็น local API server ที่เข้ากันได้กับ OpenAI ผ่านคำสั่ง litert-lm serve ทำให้เชื่อมต่อกับเครื่องมือ coding มาตรฐานอย่าง Continue, Aider, OpenCode และอื่นๆ ได้ทันที โดยใช้เทคนิค stateless prefix caching ในหน่วยความจำเพื่อจับคู่ประวัติ context และข้าม prefill latency ไปได้เลย ═══════════════════ 🚀 เริ่มต้นใช้งาน 🔹 ดาวน์โหลด weights ได้ทั้งรุ่น pre-trained และ instruction-tuned จาก Hugging Face และ Kaggle หรือจะลองเล่นเร็วๆ ผ่าน LM Studio และ Ollama ก็ได้ พร้อมมี developer documentation และ quick start notebook ให้เริ่มต้น 🔹 ทำ local inference ด้วยเครื่องมือที่ถนัดได้ทั้ง Hugging Face Transformers, llama.cpp, MLX, SGLang และ vLLM หรือจะ fine-tune อย่างมีประสิทธิภาพด้วย Unsloth ก็ได้ 🔹 สาย agent มี Skills Repository อย่างเป็นทางการให้ใช้ เป็นคลังของ skill ที่ออกแบบมาให้ agent สร้างงานบนโมเดล Gemma โดยเฉพาะ 🔹 เมื่อพร้อม deploy ขึ้น production ก็ทำได้ผ่าน Google Cloud ทั้ง Gemini Enterprise Agent Platform Model Garden, Cloud Run และ GKE ═══════════════════ 💡 ปิดท้าย แนวคิดของ Gemma 4 12B น่าสนใจตรงที่มันลดทอน encoder ที่เคยหนักหลายร้อยล้าน parameter ให้เหลือเพียง embedder จิ๋วๆ กับการ project เข้า LLM โดยตรง ทำให้ latency ลดลง อีกทั้งยังใช้ weight ชุดเดียวกันทั้งภาพ เสียง และข้อความ ซึ่งทำให้การ fine-tune ง่ายขึ้นมาก และเมื่อบวกกับผล benchmark ที่สูสีกับรุ่นที่ใหญ่กว่า ความสามารถในการรันแบบ offline บนแล็ปท็อปหรือ Mac และการเปิดเป็น open model ภายใต้ Apache 2.0 ทั้งหมดนี้ก็เท่ากับเปิดทางให้นักพัฒนานำ multimodal AI ที่ทรงพลังไปต่อยอดบน hardware ที่มีอยู่แล้วได้กว้างขึ้น โดยไม่ต้องพึ่งพา cloud หรือทรัพยากรราคาแพง
Meet Gemma 4 12B! A unified, encoder-free multimodal model designed to bring high-performance intelligence directly to your laptop, and released under an Apache 2.0 license. Bridging the gap between edge efficiency and advanced reasoning. Here is what’s new with Gemma 4 12B: 👇
3
11
4,131
May 28
quando fui rejeitado na amazon em 2022 pra SWE me senti um inútil, resolvi o leetcode na etapa de livecode mas demorei muito e acho que não tive uma linha de raciocínio muito boa isso fez eu comer conteúdo de algoritmos pelos 6 meses seguintes, e acabou me levando pra automações e extrações de dados novamente, a vida é engraçada demais o que fica é a lição: botem a cara, se arrumar uma entrevista e for mal pelo menos vai ter certeza que ta mal e que tem que estudar
6
498
Curti heim, vou voltar fazer livecode de produtos duvidosos só pra usar 👏👏
Esse overlay pra quem faz lives aqui ta top demais... c ta doido, começar a fazer lives em breve.... @manodeyvin proxima live de vibe code tem q usar
13
1,854
Today is the World Mask Week Marathon 🥳🥳🥳 Join an amazing line up of COVID resistant DJs (including me) to celebrate creativity, community and joy! My visual livecode set with dj pinkting is at 8pm est :D 12pm est - 12am est Get info incl. set times at maskweek.com
4
4
75
May 18
this seems quite doable in the space of a single 2-3 hour workshop — any brave soul want to try to livecode this for people as a learning exercise?
How to land a job at a frontier lab vladfeinberg.com/2026/05/10/…
41
17
631
99,883
repost @blue2k2_ on IG experimenting with #livecode ! been having a lot of fun recently producing beats with strudel and felt inspired by @dj_dave____ and @_switch_angel to share my own code 👨‍💻 #algorave #musicproduction
1
4
104
May 11
"Chalk: Through Tubes, We Now Are" Interactive (Livecode), 1/1 Collected by 0xclipse Thank you so much! NM 😎
1
1
26
467
May 11
"Neon: Through Tubes, We Now Are" Interactive (Livecode), 1/1 Collected by rain41 @rain41 Thank you so much!
2
15
1,434
May 11
"Pen: Through Tubes, We Now Are" Interactive (Livecode), 1/1 Collected by SonOfLasG @Sonoflasg Thank you so much!
1
6
318
𝗗𝗲𝗲𝗽𝘀𝗲𝗲𝗸 𝗩𝟰 𝗣𝗿𝗼 𝗷𝘂𝘀𝘁 𝗱𝗿𝗼𝗽𝗽𝗲𝗱 𝗳𝗿𝗲𝗲 𝗼𝗻 𝗡𝘃𝗶𝗱𝗶𝗮 𝗮𝗻𝗱 𝗶𝘁 𝗯𝗲𝗮𝘁 𝗚𝗣𝗧 𝟱.𝟱 𝗼𝗻 𝗖𝗼𝗱𝗲𝗳𝗼𝗿𝗰𝗲𝘀. And the weights are fully open. Here's what one model now does: → Scores 80.6% on SWE Bench verified → Hits 93.5% on LiveCode Bench → Holds a 1 million token context window → Plugs into Claude Code, OpenClaw, and OpenCode → Activates only 49B of 6T parameters per call 12 times cheaper than the closed frontier models. You can self host the weights for full privacy. Save this. Grab your Nvidia key tonight. Want the SOP? DM me. 💬
1
1
344
Replying to @fiuza
100%, foi um prompt simples. o gatilho pra fazer esse teste foi um mano que disse que eu estava gastando pouco token durante um livecode
3
454
Weekly livecode/livestream promoting reproducible research workflows via R, R Markdown, & Quarto NOW LIVE!! Come check it out/ask a question/lend a hand every Tuesday from 7-8 Eastern as we explore features and learn new capabilities - tonight's feature exploration is "list tables" (tables from lists - permitting complex mashups of different object types within the same table): youtube.com/watch?v=pI0hIeMH…
1
1
4
353
I'm tabling at the Black Zine Fair May 9th! It's in NY at Powerhouse Arts 🌈✨ I'm going to have new zines including this one called Livecode My Heart, which is about using the browser based program hydra for emotional processing. I'll also have zine themed keychains ✨🌈
4
5
87
Leetcode é treino, é tipo sudoku, Jiu Jitsu, xadrez, quanto mais você pratica mais habilidade você vai ter. O que muitas vezes pega em entrevista de LiveCode com Leetcode, os entrevistadores já viram aquele problema inúmeras vezes já sabem como resolver e estão te julgando. O entrevistado fica pensando na melhor maneira de resolver, um cérebro não treinado ele vai pela opção mas simplista. Esse exemplo do palíndromo, você tem uma palavra, que em programação é um array de char: [o,v,o], você inverter o array com um for simples regressivo e pegando o índex do array e comparando com a palavra original você resolve o problema. É inverter índex, simples. Mas na cabeça do candidato tem alguma pegadinha, está simples demais, os entrevistados já fizeram tantas vezes que eles tem a resposta otimizada. Agora um desafio que eu faço pros entrevistadores, quer usar LeetCode, abri a plataforma de Leetcode na hora e pega um problema aleatório pra ele resolver junto com o candidato, mostra também sua habilidade pro candidato em resolver Leetcode. Aí o bicho pega hein 🔥🔥🔥
7
2
141
6,188
Leetcode é treino, é tipo sudoku, Jiu Jitsu, xadrez, quanto mais você pratica mais habilidade você vai ter. O que muitas vezes pega em entrevista de LiveCode com Leetcode, os entrevistadores já viram aquele problema inúmeras vezes já sabem como resolver e estão te julgando. O entrevistado fica pensando na melhor maneira de resolver, um cérebro não treinado ele vai pela opção mas simplista. Esse exemplo do palíndromo, você tem uma palavra, que em programação é um array de char: [o,v,o], você inverter o array com um for simples regressivo e pegando o índex do array e comparando com a palavra original você resolve o problema. É inverter índex, simples. Mas na cabeça do candidato tem alguma pegadinha, está simples demais, os entrevistados já fizeram tantas vezes que eles tem a resposta otimizada. Agora um desafio que eu faço pros entrevistadores, quer usar LeetCode, abri a plataforma de Leetcode na hora e pega um problema aleatório pra ele resolver junto com o candidato, mostra também sua habilidade pro candidato em resolver Leetcode. Aí o bicho pega hein 🔥🔥🔥
4
1
139
7,880
We can now livecode music in the terminal! 🔥 🎛️ O₂ — ORCΛ livecoding environment with a TUI 💯 Phase-locked MIDI, zero allocations per frame & smooth terminal rendering 🦀 Written in Rust & built with @ratatui_rs ⭐ GitHub: github.com/coignard/o2 #rustlang #ratatui #tui #orca #music #livecoding #creativecoding #terminal
6
3
33
1,366