Founding Engineer & Full Stack Engineer @kotoba_tech, Research Fellow @ReazonHILab, Science Tokyo ← Iwate Univ, Ex: @Elith_pr

Joined April 2020
313 Photos and videos
Sloth🦥 retweeted
FYI: sherpa-onnx has supported nemotron-3.5-asr-streaming-0.6b see github.com/k2-fsa/sherpa-onn…
2
17
753
やっぱワールドカップの開幕セレモニーはいいね! 開幕戦楽しみなのねん
1
575
Sloth🦥 retweeted
Today, I’m proud to announce Homebrew 6.0.0. Since 5.1.0: secure tap trusting, faster JSON API, Linux sandboxing, better defaults, brew bundle improvements, improved performance, initial macOS Golden Gate support. brew.sh/2026/06/11/homebrew-…
86
507
5,145
311,881
Sloth🦥 retweeted
React Native has a new home now🎉
10
33
951
303,391
Sloth🦥 retweeted
One of my personal favorite features announced at WWDC will I suspect be a sleeper hit: container machines, allowing your Mac to run a lightweight, persistent Linux environment with your home directory and repos automatically mounted: github.com/apple/container/b…
227
815
9,698
729,251
Sloth🦥 retweeted
Dr. SHAP-AV has been accepted to Interspeech 2026 in the Long paper Track (acceptance rate ~29%)! More info (code,ckpts etc.) in the project website: umbertocappellazzo.github.io… Look forward to presenting it in Sydney ( 2 regular papers I co-authored)🇦🇺🦘🐨

Umberto Cappellazzo, Stavros Petridis, Maja Pantic, "Dr. SHAP-AV: Decoding Relative Modality Contributions via Shapley Attribution in Audio-Visual Speech Recognition," arxiv.org/abs/2603.12046
2
8
1,104
github.com/reazon-research/R… しょうもないんですが、AVistaモデルの推論コードでcacheを使う経路の実装を忘れており、それの対応がマージされましたーー ちゃんと最低限の演算だけするようになったので、ちゃんと運用できる推論速度が出るようになったと思います! HFのremote codeも更新済みです🙏
1
1
7
647
今までは、Encoderをdecoderの生成トークン数回しちゃっていた....
1
395
Transformers v5対応はこれから対応予定でごんす
333
Sloth🦥 retweeted
Kotobaの同時通訳アプリをテレ朝さん(@EXfushiginokai)に特集して頂きました! 全ての同時通訳アプリユーザーが夢を見られる楽しい夏になりますように :) tver.jp/episodes/epy340m62i(16分台から) 同時通訳アプリは3ヶ月の大規模パワーアップ中で、10個以上の大型アップデートの最中です。過去1ヶ月には、更なる多言語化、通訳の速度と精度のカスタマイズ、音声メモ、AIサマリーなどをリリースしました。 次の1ヶ月では、革新的なUI・UXアップデート、エンプラユースケースにも対応したリモートミーティングモード、Desktopアプリなども順次公開していく予定です!Blog postでも公開の全貌をまとめていきます。 同時通訳アプリは、対面でもオンラインでも、スマホでもウェアラブルでもパソコンでも、どの言語でも、同時通訳でもミーティングのライブ音声メモでもミーティングのリアルタイム補助でも、個人ユーザーでも企業ユーザーでも、全ての人の多言語コミュニケーションを強力にサポートするグローバルプロダクトに進化している最中です。
1
13
90
1,834,963
Sloth🦥 retweeted
これは必読!Thread Block ClusterやCUDA Tileのような新しいCUDA要素まで含めた日本語の解説は他にあまりないのでは。 私はCUDAプログラマというわけではないのですが、それでもこの記事で解説されているようなGPUの構造をある程度把握しておけば、例えばTOP500リストに出てくる "Accelerator/Co-Processor Cores" がCUDAコア数と全然合わないけどこれはSMの数だったんだなぁとか、MIGの分割最小単位ってつまりGPCで、A100は8個のGPCのうち7個が有効になってるからMIGは7分割とか半端になるんだなぁとか、腑に落ちることがあって人生が少し楽しくなりますよ!
テックブログ公開 Day5です FlashAttentionや昨今のHardware Awareな高速化手法を理解したり、提案したりする上で必須となるCUDA Programmingに関して、基礎から解説していくブログシリーズの第一弾です。3万字超えのブログですが、かなり分かりやすく書いていますのでぜひご覧ください。 CUDA Programming Guide Part 1|Kazuki Fujii zenn.dev/kaz20/articles/1e62…
1
12
110
18,856
Sloth🦥 retweeted
Second big release from us today: Nemotron-3.5-ASR-Streaming! 🌎40 languages ⚡️80ms - 1s controllable latency 🔥240 - 2400 concurrent streams on 1xH100 🧱FastConformer Cache-Aware RNN-T architecture huggingface.co/nvidia/nemotr…
23
118
980
60,175
Sloth🦥 retweeted
恒例の ICASSP 論文読み会ですが、6/22 (月) に株式会社ディー・エヌ・エー様に会場をご提供いただき実施する運びとなりました!皆様ぜひご参加ください🙏🙏🙏 #icassp2026jp
ICASSP2026論文読み会(東京&オンライン) を公開しました! icasspeech.connpass.com/even… #icassp2026jp
13
22
4,871
Sloth🦥 retweeted
昨日に引き続きブログ公開 Day 2です。 KV cacheの基礎について、「Key, ValueだけcacheしてQueryをcacheしないのはなぜか?」という問いに答える形式でやさしく解説を行いました。 MLエンジニアのための本質から理解するLLM推論 KV cache編|Kazuki Fujii zenn.dev/kaz20/articles/c77f…
普段利用しているNVIDIA NGCをGPU Clusterで利用するときの環境構築方法についてTips記事を執筆しました。 Tips: Containerを利用したDL分散学習Libraryの開発環境|Kazuki Fujii zenn.dev/kaz20/articles/ff41…
47
390
50,292
Sloth🦥 retweeted
May 28
Introducing Claude Opus 4.8: it builds on Opus 4.7 with sharper judgment, more honesty about its own progress, and the ability to work independently for longer than its predecessors. Available today at the same price.
3,687
8,627
67,437
15,240,932
Sloth🦥 retweeted
huggingface.co/blog/norwoood… コールセンター音声のASR性能比較 WERで比較しており、Whisper-mediumが一番良かった 直感的にはでかい方が良さそうな気がするが、largeはハルシネーションが酷かったらしい
7
27
2,067
Sloth🦥 retweeted
これはまずい。まだSponsored resultとして出てくる。うまくgoogleドメインに見せている。実行したらMacを乗っ取られる
MacでGoogleで"HomeBrew"を検索すると本物そっくりのサイトが出てきて怖い Windowsからの検索では出てこない そのサイト上のHomeBrewをインストールできそうな怪しいスクリプトをダウンロードして実行するコマンドは怖くて実行してない
15
1,390
2,094
441,668
Sloth🦥 retweeted
I'm attending #MLSys2026 for the full week! We'll be presenting two works. 1️⃣ At the main conference on Tuesday, we'll present TeleRAG, an inference acceleration technique for agentic RAG. Paper: arxiv.org/abs/2502.20969 Code: github.com/uw-syfi/TeleRAG
2
5
16
1,508