Co-founder & CTO at 당근(Karrot)

Joined February 2009
422 Photos and videos
Unsloth의 Gemma4 MTP GGUF 소식을 보고, DGX Spark에서 실제로 얼마나 빨라지는지 테스트해봤습니다. - 12B Dense: 1.92x - 26B-A4B MoE: 1.16x - 31B Dense: 2.22x MTP는 dense 모델에서 효과가 컸고, 26B-A4B는 MoE라 이미 빠른 편이라 추가 이득이 작았습니다. 번역 제목 벤치에서는 품질 저하도 거의 안 보였습니다. seapy.com/gemma4-mtp-dense-v…
2
3
147
미국 인증 가능한 전화번호 하나쯤은 있어야 되는 시대인것도 같고. 한국에서도 SMS 받을수 있는걸로...
知名网络安全巨头 NordVPN 旗下的全球旅游 eSIM 品牌 Saily(在 2026 年 6 月 11 日)刚刚全网首发推出的全新原生美国( 1)电话号码服务。由于是刚上线几天的重磅新功能,所以配合推广优惠码的开卡价格和月租被直接打到了骨折。 根据第一批用户的检测报告,Saily 分配的号码底层是由美国 Choice Wireless Texas 提供的实体蜂窝网络。它在系统识别中是真正的 Cellular 原生手机号,拿来接收 2FA 验证码和各种 App 注册,通过率和稳定性降维打击那些虚拟号。 根据 Saily 官方的底层规则:只要你保持每月 $0.99 的号码订阅(保号费)在续费,哪怕你没有额外购买任何短信流量包,它的“接收短信(Incoming SMS)”功能也是无限量且完全免费的! 也就是说,如果你下个月只是单纯用来躺在手机里收验证码,连那 1 美元的短信包都不用叠加,保号成本无限逼近于零。 Saily 作为面向全球旅行者的 App,直接支持中国大陆身份证直接线上 KYC 认证,并且支持 Apple Pay、支付宝或国内双币卡直接付,对国人友好度拉满。
4
7
1,105
DGX Spark 에서 만만한 Gemma 4 가지고 실험하는거 말고 좀더 큰것들도 해보고 싶다. Gemma 4 는 실험하고 마는거고 Kimi 나 MiniMax 같은거는 실 사용도 해보면서 경험 할수 있을거 같은데 로컬이나 클라우드에 직접 돌렸다가는 가성비도 안나오고 속도도 느리겠지
1
1
12
825
다양한 LLM 모델을 써본다는 게 생각보다 쉽지 않다. 벤치마크도 참고는 되는데 결국 내가 직접 느껴봐야 하고, 그러려면 같은 일을 여러 모델에 반복해서 시켜봐야 한다. 근데 이게 은근히 어렵다. 차이가 미묘하면 이게 진짜 차이인지도 잘 모르겠고. 그래서 대부분은 그냥 사람들이 좋다고 하는 모델을 몇 개 써보고 마는 것 같다. 반대로 계속 여러 모델을 써보는 사람들은 모델의 변화에 대한 감각을 조금씩 쌓아가는 느낌이고. 요즘 내가 느끼는 건, 일정 수준 이상의 모델이라면 모델 자체의 차이도 있지만 사람이 스티어링을 잘하면 결과가 꽤 비슷해지는 경우도 많다는 점이다. 그런데 Hermes 같은 에이전트 시스템을 쓰다 보면, 앞으로는 그 스티어링의 일부도 사람이 아니라 시스템이 해주게 될 것 같기도 하다.
3
18
1,166
X API로 글을 쓰는 비용, 공식 pay-per-use 기준으로 일반 포스트는 $0.015(약 23원), URL 포함 포스트는 $0.200(약 303원)입니다. 참고로 이 글도 API로 올렸으니 방금 23원 썼습니다. 💸
2
6
746
Sonnet 은 사용할 생각을 전혀 못했는데 이런 차이도 있구나
Opus 4.8は自走力が低く、しばらく走るとすぐに「次はどうしますか」と聞いてくる。最後までやれって言ったでしょ。その点、sonnet 4.6は「テストが全部成功するまで」と依頼したら24時間以上連続動作した(が、トークンを使い切って終了)。
2
8
1,286
이번 주에 안 그래도 DJI Pocket 4P 예약 진행한다는 문자를 받았는데, 예전처럼 그냥 출시 후 사는 게 아니라 예약을 받는 걸 보니 물량이 부족한 건지, 수요를 가늠하려는 건지 좀 궁금하네요. dpreview.com/news/4889023910…
2
602
Jun 13
이거 생각보다 모르는분들이 많은데 잘 정리해주셨네요.
[New Post] 1Password SSH 에이전트로 로컬 SSH 키 안전하게 관리하기 blog.outsider.ne.kr/1799
3
24
4,241
Seapy retweeted
GLM-5.2 on KingBench (3). Thoughts: The model has superb taste. It is greater at UX than UI. The code is always very clean. It is great at One-shot wonders. I asked it to fine-tune a whole local model and it did it in 30mins! This is just a great model to use all-round. 1/n
54
103
1,554
175,580
Jun 13
테터링 30기가 까지 제대로 사용해본적이 없어서 30기가 테터링 되는게 필요한가 싶었는데, 오늘 테슬라 업데이트할때 Mudi 7에 테터링으로 하니까 10기가 금방 넘고, 외부에서도 무료 와이파이 안쓰고 Mudi 7 사용하니까 조금씩 사용량이 높아짐. 크기만 좀 작았으면 Mudi 7 참 좋은데...
1
5
1,462
Jun 13
모델 몰아서 나오는 시즌이네. 마침 Fable5 사용도 불가능해졌는데 GLM 5.2, Kimi 2.7, MiniMax 3 같은거 나와서 사람들 관심은 어차피 못쓰는 Fable5 보다는 GLM 쪽 해볼것도 같고요.
刚刚 @Zai_org 发布了GLM5.2🔥🔥🔥 GLM-5.2 是智谱迄今能力最强的开源模型,支持真正可用的 1M 上下文,并在长程任务中继续保持领先。 它也依旧是我们心中最强的中国 Coding 模型。 今晚 5:21(北京时间)GLM-5.2 将面向 GLM Coding Plan 全量用户开放,覆盖 Lite / Pro / Max / 团队版。 GLM-5.2 API 将于下周上线,模型下周正式开源,遵循 MIT 协议。 在一些前沿模型突然变得不可用的时刻,他们选择相信另一条路:前沿智能不应只属于少数人,也不应被少数规则随时收回。 它应该开放、可用、可构建,并服务于每一位开发者。 🫡真正的人类之光
3
1
22
3,530
Jun 12
6x 하이퍼 스피드 모드 궁금하다
🌘 Kimi-K2.7-Code, our latest coding model, is now released and open-sourced! 🔷 Improved coding & agent performance over K2.6: 21.8% on Kimi Code Bench v2, 11.0% on Program Bench, and 31.5% on MLS Bench Lite. 🔷 Reasoning efficiency: Less overthinking, with 30% lower reasoning-token usage compared to K2.6. 🔷 Long-horizon coding: Improved instruction following, higher end-to-end coding task success rates. ⚡️ 6x High-Speed Mode coming soon! 🔌 Available today via Kimi API and Kimi Code. 🔗 Kimi Code: kimi.com/code 🔗 API: platform.moonshot.ai
6
909
Jun 8
써봐야 알거 같은데 우선 신청만... Mimo 도 괜찮다고는 한거 같은데 안써봐서 감은 안오네요
🚀 1,000 TOKENS/S ON A 1T MODEL! 🚀 We are thrilled to release Xiaomi MiMo-V2.5-Pro-UltraSpeed in collaboration with @TileRT_AI , breaking the 1,000 tokens/s output speed on a 1 Trillion parameter model for the FIRST TIME! Not wafer-scale integration like Cerebras. Not pure on-chip SRAM chips like Groq. We achieve 1,000 tps on a 1T MoE model using just a SINGLE, STANDARD 8-GPGPU NODE. Read the full technical deep dive:mimo.xiaomi.com/blog/mimo-ti… Want to experience the future of real-time AI? 👉 Apply for UltraSpeed now: platform.xiaomimimo.com/ultr… ⏳ Limited-Time Access: Application-based · Jun 8 – Jun 23 (PDT) 💬 Chat Experience: Completely FREE for a limited time — try the blazing-fast web chat now. ⚡ UltraSpeed API: Just 3x the price for a ~10x boost in output experience. 🤝 Enterprise & Large-Scale Needs: business-mimo@xiaomi.com
2
549
Jun 8
이 시간에 Claude 사용해본적이 자주 없었는데... 정말 Claude 가 낯에 사용할때랑 다르게 많이 느린거 같은데 -_-a 아니면 낯에는 다른일도 많아서 신경 안쓰는데 저녁에는 저기에만 집중해서 그러나
1
5
838
Jun 8
새로운 릴리스 나올 때마다 AI 에이전트한테 QA 엔지니어 역할 맡겨서 수동 테스트 여러 가지 직접 시켜보는 마크다운 파일 만드는 거, 진짜 실용적이고 좋은듯. 요즘 로컬 LLM 비교 하면서도 느낀게 어느정도 정답이 있는거에서는 잘하는것같음
[blog] A new era for software testing: antirez.com/news/168
5
31
3,386
Jun 8
몇시간후면 애플 WWDC, 예전에는 새로운 OS 를 기대했지만 이제는 OS 필요없고, 하드웨어 기대감이 제일 크네요. 느슨해진 WWDC에 긴장감을 주네요.
8
382
Seapy retweeted
Jun 8
6월9일 새벽2시 Apple WWDC 2026 혹시 모를 M5 Ultra 출시를 앞두고 기보유중이던 맥스튜디오를 떠나보내려합니다 128GB라 그런지 당근 올리자마자 연락 엄청 받아서 금방 팔렸다는 M5 Ultra 안나오면 맥북에어도 팔고 M5 Max 128GB 맥북프로로 넘어가야지
5
2
29
4,503