Joined September 2010
1,533 Photos and videos
Pinned Tweet
12 Apr 2025
toyKasketの新譜です!よろしくお願いします〜!
【M3 2025春 告知】 2025年春M3にて、toyKasketメンバーと3名のゲストによるMMO-RPG風コンピレーションアルバム「La Kasketia2」をリリースします! ブース:第2展示場1F お-24ab 頒布価格:1,000yen SoundCloud soundcloud.com/toykasket-off… 特設サイト、MV、通販準備中です。
1
1
2
2,848
Jun 13
今もコンパイラのバグや機能追加は機械語を理解していないとできないわけだけど、そのスキルが必要とされるのはごく一部の人間だけなわけで、プログラミング言語もその立ち位置になるのかな
177
Jun 13
Fable、むしろ本格的に輸出規制かかって日本でも頑張って作らなきゃって予算が下りたほうが長期的にはいいのでは?と思ったり
195
Jun 12
AIでパワポ生成、パワポ作る目的って自分の考えや知識を整理して人に伝えることなわけだけど、自分の考えや知識、伝えたいことを事細かにAIに教えないと良い資料を作ってくれないので、文章に落とし込むだけの時間があったらパワポ出来上がってしまう 任せるタスクとして本質的に適していない気がする
1
262
Jun 12
AIに常に全ての会議に出席して全ての資料を頭に叩き込んでもらった状態でいてもらわないと生産性上がりようがなさそう
154
Apr 30
これって結局多くの人間の目があったからゴブリンを根拠なく使いがちっていう事実に気づいたわけで、AIに任せきりにするのはまだまだ無理そうで、手放しにすると変な方向に突っ走ってしまう、ということをよく示してるよな
Apr 30
We’re talking about Goblins. openai.com/index/where-the-g…
1
332
おはようございます。 本日のM3にて、新譜「Overslept 」を頒布します。 皆様、どうぞよろしくお願いします!
1
2
334
Apr 25
本日出展します!よかったら見ていってください!
【M3 2026春 告知】 ブース:第一展示場 K-01b 明日のお品書きです。昨年リリースしたLa Kasketia2がありますので、1000円で頒布します。こちらもあわせてどうぞ!
1
1
299
【M3 2026春 告知】 -深い眠りへ堕ちていく-『Overslept』 ブース:第一展示場 K-01b 頒布価格(会場):500yen MV製作: yoshimo(@yoshimo_mon) #M3春 #M3春2026 動画を修正しましたので、再ポスト致しました。 関係者と動画に反応いただいた方にご迷惑をおかけしましたことをお詫び申し上げます。
1
18
84
6,565
【M3 2026春 告知】 2026年春M3にて、toyKasketメンバーによる「睡眠」をテーマとしたEP、「Overslept」をリリースします! ブース:第一展示場 K-01b 頒布価格:500yen 視聴用URL(SoundCloud) soundcloud.com/toykasket-off… 特設サイト、MV、通販準備中です。 どうぞよろしくお願いします!
18
51
3,349
Apr 23
メタい考え方をすると、AI以前のホットなシステムの課題って、どうやってスケールさせるかみたいなところだったから、すべてのAIによる自動化が進んだ暁には今のAIエージェントが数百ステップかかる作業を100万人に対してそれぞれ1秒以内に完了させるにはどうしたらいいか、みたいなのになるんだろうな
151
Apr 22
Qwen 3.6 35B、Artificial Analysisをよく見ると3.5と比べて若干IFBenchを犠牲にしているので、27Bもその傾向だろうとするとコーディング規約とかを無視しつつ暴走機関車のように彼が思うがままにコードを書くエージェントになりそう
1
700
Apr 22
ローカルのコーディングエージェント、昨年12月のDevstrall Small 2あたりから、30Bレベルのサイズでもコーディングエージェント行けるんか!?ってなってそっから爆速で発展した感じある
205
Apr 20
アニメでロストテクノロジーを原理を理解しないまま使ってる、みたいなのってよくあるけど、将来AIによって発明された、人間が原理を理解していないテクノロジーをなんだかよくわからないまま使うっていう未来もあるのかもしれぬ
1
199
Apr 11
晴れてよかった
6
146
Apr 8
Metaが復活!?
174
Nush retweeted
Meta is back! Muse Spark scores 52 on the Artificial Analysis Intelligence Index, behind only Gemini 3.1 Pro, GPT-5.4, and Claude Opus 4.6. Muse Spark is the first new release since Llama 4 in April 2025 and also Meta's first release that is not open weights Muse Spark is a new model from @Meta evaluated on Artificial Analysis. We were given early access by Meta to independently benchmark the model. It is the first frontier-class model from Meta since Llama 4 Maverick was released in April 2025, and notably the first @AIatMeta model that is not being released as open weights. The release follows Meta's reorganization of its AI efforts under Meta Superintelligence Labs, and signals that Meta is re-entering the frontier race after roughly a year of relative quiet. For context, Llama 4 Maverick and Scout scored 18 and 13 respectively on the Artificial Analysis Intelligence Index as non-reasoning models at the time of their release, while Muse Spark scores 52. Muse Spark essentially closes the gap between to the frontier in a single release. The model is not open source and is not yet accessible via an API but Meta has shared they expect this to come soon. Meta is also integrating Muse Spark into their first party products including their Meta AI chat product, Facebook, Instagram and Threads. Key takeaways from our benchmarks: ➤ Muse Spark scores 52 on the Artificial Analysis Intelligence Index, placing it within the top 5 models we have benchmarked. It sits ahead of Claude Sonnet 4.6, GLM-5.1, MiniMax-M2.7, Grok 4.20 and behind Gemini 3.1 Pro Preview, GPT-5.4 and Claude Opus 4.6 ➤ Muse Spark is notably token efficient for its intelligence level. It used 58M output tokens to run the Intelligence Index, comparable to Gemini 3.1 Pro Preview (57M) and notably lower than Claude Opus 4.6 (Adaptive Reasoning, max effort, 157M), GPT-5.4 (xhigh, 120M) and GLM-5 (110M) ➤ Muse Spark is the second-most capable vision model we have benchmarked. It scores 80.5% on MMMU-Pro, behind only Gemini 3.1 Pro Preview (82.4%) ➤ Muse Spark performs strongly on reasoning and instruction-following evaluations. It scores 39.9% on HLE, trailing only Gemini 3.1 Pro Preview (44.7%) and GPT-5.4 (xhigh, 41.6%). The model also achieved 5th highest in CritPT with a score of 11%, an eval that is focused on difficult physics research questions. This is substantially above above Gemini 3 Flash (9%) and Claude 4.6 Sonnet (3%) ➤ Agentic performance does not stand out. On GDPval-AA, our evalaution focused on real world work tasks, Muse Spark scores 1427, behind both Claude Sonnet 4.6 at 1648 and GPT-5.4 at 1676, but ahead of Gemini 3.1 Pro Preview at 1320. On On TerminalBench Hard, Muse Spark trails Claude Sonnet 4.6, GPT-5.4, and Gemini 3.1 Pro. Muse Spark joins others in achieving a high τ²-Bench Telecom score of 92% Key model details: ➤ Modalities: Multimodal including text and vision input, text output ➤ License: Proprietary, Meta's first frontier model not released as open weights ➤ Availability: No public API at the time of publishing. Meta expects to provide API access soon. Meta has started integration into their first party AI offering Meta AI and inside Facebook, Instagram, and Threads
78
319
2,451
506,612
Apr 2
opencodeの人のDiscordでの晒し上げに関するツイートを見て、やっぱopencode倫理観ヤバそうだな、使わないでおこう、と思った
2
327
Mar 31
バイブコーディングで自分用に作ってたアプリ、バニラのHTMLのJSで、そろそろなんかのフレームワークに移行させようかと思ってたけどaxios事件を見て個人用のアプリ程度ならバニラで良かったかもって思った
1
220
Mar 26
ふと思ったけど、たとえAIがAIの性能を改善することが可能になったとして、改善するための学習、本当に改善されているかの実験や評価って結局古典コンピューターを長時間回さないと結果が出ないから、自動化されたとしてもAIの発展速度ってそこまで加速できないのでは?
1
233
Mar 26
少なくとも1秒後に倍の賢さ、みたいなことにはならん気がするな 半年で4倍の賢さ、とかはありそうだけど
186