Joined June 2023
603 Photos and videos
朝習慣を制すものが人生を制する。 社会人6年目で、営業キャリアからスタートして、 執行役員、子会社代表、プロダクトPMを務めるに至った 18の習慣の話👇
2
15
1,087
📰 「みんながAIを使っている」は幻想 — 労働人口の3割しか使っていない実態 DuckDuckGoのGabriel Weinbergによる分析。 Microsoftのデータでは労働年齢人口の約30%しかAIを利用しておらず、メディアの「全員が使っている」ナラティブとの乖離が鮮明になっている。 Gen Zでさえ約2割は「全く使わない」と回答。 💡 なぜ重要か 利用をためらう理由は雇用喪失への懸念(42%)、プライバシー(35%)、誤情報(33%)の順。 AIの社会的純評価スコアは 8%にとどまり、携帯電話の 68%・インターネットの 67%と大きく異なる。 HNのコメント欄では「特定タスクでは有効だが別領域では役に立たない」「高速なStackOverflow代わりに使う」など実務での混在した評価が集まった。 AI活用を顧客向けに推進する際も、受け手の多数が依然として懐疑的・未使用層である現実を数値で把握しておく必要がある——“普及の演出”と“実需”を切り分ける重要な基準線だ。 🔗 news.ycombinator.com/item?id…
1
1
21
📰 実装前に設計を“尋問”するスキル /grill-me — 手戻りを防ぐ要件詰め 複数AIエージェントの並行実行が当たり前になる中、実装後に要件のズレが判明するリスクが増大している。 これを受けMatt Pocock氏が開発した「/grill-me」スキルを日本語で解説した記事。 従来のプランモードは全体設計を一括提示するため人間が受動的に承認しがちで主導権を失う構造だった。 💡 なぜ重要か /grill-meは設計ツリーの各分岐を一問ずつ質問形式で掘り下げ、人間主導で共通理解を段階的に構築する。 実装段階で高忠実度な質問が出る場合はプロトタイプ作成後に再開する「ハンドオフパターン」も採用。 暗黙知や曖昧な要件を残したまま実装に入ることで起きる大規模な手戻りを防ぐ設計思想で、「機械に任せきらず、自分の頭の設計をAIと協力して言語化する」能動的関与の重要性を示す。 AIとの開発プロセスを設計する観点で実用性が高い。 🔗 azukiazusa.dev/blog/before-i…
2
40
ひろきん|マーケAI OS「ENSOR」開発者 retweeted

2,458
6,707
34,179
53,573,062
📰 100万トークン対応コーディングLLM「GLM-5.2」公開、来週MITでOSS化 中国Z.aiが最大100万トークンのコンテキストに対応するコーディング特化LLM「GLM-5.2」を公開した。 1回の応答で最大128,000トークンを生成でき、大規模コード処理や長期エージェントタスクを得意とする。 前世代GLM-5.1は744億パラメータのMoEで、開発ベンチ「SWE-Bench Pro」で58.4%を記録。 💡 なぜ重要か 今回は4ヶ月で3世代目の更新となり、MiniMax M3やKimi K2系との競争が激化するオープンウェイト市場で存在感を高める。 来週中にHugging FaceでMITライセンスのモデルウェイトが公開予定で、自由な利用・改造が可能になる。 現状は特定プラン向けの限定提供だが、広く開放されれば長文コンテキスト×高性能コード生成を無償で活用できる選択肢が増える。 プロプライエタリAPIへの依存を下げたい開発チームにとって、バックエンド選定の見直しを促す一報だ。 🔗 pc.watch.impress.co.jp/docs/…
138
📰 「SaaSの死」に会計ソフトfreeeが逆張り — AIエージェント時代の設計思想4つ freeeのCAIO横路隆氏が、AIエージェント時代に自社サービスをAIネイティブへ再設計する戦略を語った。 MCPサーバーとスキル(業務マニュアル)を開放し、Claude Code等が直接freeeを操作できる環境を整備。 設計思想の転換は4点。 💡 なぜ重要か ①APIドキュメントだけでなく複数業務タスクの組み合わせ方をAIに教える「スキル」整備、②AIの行動を制限し検証可能にする「ガードレール」、③「何を根拠に判断したか」というAIの思考過程までログ化、④基盤を作り込みすぎず変化するモデルに柔軟対応する設計。 「AIが業務を担うとSaaSは土管化する」との懸念に対し、逆にAIネイティブ化すればAIが自社サービスを推奨する副次効果も生まれると指摘した。 プロダクトを“エージェント経由で使われる前提”で設計し直す動きは、BtoB SaaS全域に波及が予想される実践事例。 🔗 businessinsider.jp/article/2…
1
95
朝活:DAY375 おはようございます! 評価者と実行者の切り分けでsubagentを使い分けるでもいいけど、open routerが出してるfusion model使うのが一番手っ取り早そうだな。(コストは掛かるけども…!)
📝ナニコレ?OpenRouterから急にFable 5級のモデルをコスト半額で出してきたよ? Fable 5が使えなくなって、米政府の輸出規制で、Anthropicの最強モデルが全世界停止中のさなか、、、 そのタイミングで出てきたOpenRouterのFusion APIのベンチマークがこれ、Fable 5レベルってどゆこと? ・Gemini 3 Flash Kimi K2.6 DeepSeek V4 Proを組み合わせたパネル  → 単独のGPT-5.5と単独のOpus 4.8を完全に上回った  → Claude Fable 5との差はわずか1%以内  → 価格はFable 5のだいたい半分 仕組みはシンプルで、複数のAIに同時に質問を投げて、審判役のAIが答えを分析し、まとめ役が最終回答を作る。 使う側は「ただ一つのAIに聞いた」ように感じる。 最強モデルが消えた日に、その代替が半額で出てきた モデルを試せるサイトがあるけど、、、今のところその差を比べるためのFable 5が使えないからなんとも言えない、、、
1
68
📰 Anthropic、Fable 5・Mythos 5を全世界で即時停止 — 米政府指令を巡る公式声明 米政府が国家安全保障を理由に最上位モデルFable 5とMythos 5へ輸出管理指令を発出し、Anthropicは6/12 17:21の受領後、全ユーザーのアクセスを即時無効化した。 政府の根拠は「狭く限定的なジェイルブレイク手法」の存在で、AmazonのジャシーCEOが政府にセキュリティ懸念を報告したのが引き金とされる。 💡 なぜ重要か 一方Anthropicは「同種の欠陥は他の公開モデルでも検出可能」と反論し、数千時間のレッドチームを経た多層防御を実装済みと主張。 David Sacks大統領AI顧問は「修正されれば規制を解除したい。 主導権はAnthropic側にある」と条件付き協議の姿勢を示した。 Opus等の既存モデルは正常稼働を継続。 AI企業が輸出規制の対象となり、フロンティアモデルのリリース可否に政府が関与した初の大型前例で、APIを中核に据えるサービスはモデル可用性リスクと代替策の常備が現実的論点になった。 🔗 anthropic.com/news/fable-myt…
121
📰 OpenAIがOna(旧Gitpod)を買収へ — コーディングエージェントの主戦場は「実行環境」に移った OpenAIが2026年6月、クラウド開発環境企業Ona(旧Gitpod)を買収したと報じられた。 狙いはCodexエージェントを企業のVPC内に統合するための実行基盤の獲得。 「顧客管理実行モデル」により、OpenAIが提供するエージェント(頭脳)と顧客VPC内のサンドボックス(実行環境)を分離し、Dev ContainersとAGENTS.mdという業界標準仕様を採用する。 💡 なぜ重要か 人間向けのクラウド開発環境としては不振だったGitpodが、エージェントの実行基盤として急転直下で価値化した点が興味深い。 AI競争の主戦場が「モデル性能」から「エージェント実行環境の安全性・再現性・監査証跡」へ移りつつあることを示す象徴的なM&Aで、コーディングエージェントを使う企業は戦略の見直しを迫られる。 🔗 zenn.dev/okssusucha/articles…
1
57
📰 Anthropic公式: マルチエージェント研究システムの構築方法 Anthropicが自社のマルチエージェント協調型リサーチシステムの設計ノウハウを公開した。 単一エージェント比で性能が90.2%向上し、その差の約80%はトークン使用量で説明できるという(マルチエージェント化でトークン消費は単一チャットの約15倍)。 💡 なぜ重要か 構造はオーケストレーター+ワーカーで、リードエージェントが戦略立案と調整を担い、複数サブエージェントが独立したコンテキストウィンドウで並列実行する。 実用上の要点は①委譲時の明確な指示設計、②並列ツール呼び出しで最大90%の時間削減、③LLMジャッジによる評価を約20クエリから即開始すること。 本番課題として状態管理・非決定性デバッグ・同期実行のボトルネックが挙げられ、非同期実行が改善方向として示された。 サブエージェント運用を設計する人に直接効く実践知。 🔗 anthropic.com/engineering/mu…
63
📰 MCP連携でOpus 4.8超え、1兆パラメータLLM「Kimi K2.7 Code」が無償公開 Moonshot AIがコーディング特化のオープンソースLLM「Kimi K2.7 Code」を無償公開した。 総パラメータ1兆・アクティブ320億のMoEモデルで、推論時のトークン使用量を前世代比30%削減。 MCPサーバー連携の評価指標「MCP Mark Verified」で81.1%を記録し、Claude Opus 4.8(76.4%)を上回った。 💡 なぜ重要か ビジョンエンコーダーを搭載し画像入力にも対応、Modified MITライセンスでローカル利用・API利用・カスタマイズが自由という点も大きい。 クローズドモデルに依存せずMCP連携エージェントを構築したいケースで有力な選択肢になる。 オープンウェイト勢の実力が、領域を絞れば最上位クローズドモデルを部分的に超え始めたという競争構図を象徴する一件。 🔗 pc.watch.impress.co.jp/docs/…
141
📰 「Claude Code」を支える技術 — AI推論はわずか1.6%、残りは「ハーネス」 リークされたClaude Codeのソースコードを分析した論文ベースの解説。 実装のうちAI推論に関わる部分はわずか1.6%で、残り98.4%は「ハーネス」と呼ばれる制御環境が占めることが明らかになった。 ハーネスはパーミッションゲート、5段階のコンテキスト圧縮、4段階のツール拡張(フック→スキル→プラグイン→MCP)、サブエージェント、JSONL形式のセッション永続化で構成される。 💡 なぜ重要か 設計思想は「AIを制限する」のではなく「AIに裁量を与えつつ、周囲の環境を徹底的に作り込む」こと。 エージェント製品の競争力がモデル単体の賢さではなく、それを取り囲むハーネス設計に宿ることを具体的に示しており、スキル・フック・MCPを自分の業務に組み込んでいる人ほど示唆が大きい。 🔗 zenn.dev/knowledgesense/arti…
2
166
📰 米政府がAnthropicに最強モデル「Fable 5」「Mythos 5」の提供停止を命令 米国政府が国家安全保障を理由に、Anthropicの最上位モデル「Fable 5」「Mythos 5」へのアクセス全停止を命令し、同社が6月12日に即日従ったと報じられた。 政府側の根拠は「ジェイルブレイク(安全制限の回避)の発見」だが、Anthropicは「他社の公開モデルでも再現できる小規模な脆弱性に過ぎず、この基準を全メーカーに当てはめれば事実上すべての新型モデルの展開が止まる」と強く反論している。 💡 なぜ重要か 引き金になったのはAmazon CEOアンディ・ジャシーが財務長官らに伝えたセキュリティ懸念とされ、Amazonは最大330億ドルを出資する筆頭投資家でありながら投資先を当局に告発する利益相反的な構図が議論を呼んでいる。 フロンティアLLMが「デュアルユース技術」として安全保障規制の対象になった初の大型事例。 Opus 4.8等の他モデルは引き続き利用可能だが、AIサービスの提供継続性リスクとガバナンス整備の重さを突きつけた一件。 🔗 nikkei.com/article/DGXZQOGN1…
54
📰 TCSとAnthropicが戦略的パートナーシップ — 56カ国5万人にClaude展開 TCS(タタ・コンサルタンシー・サービシズ)がAnthropicと戦略的パートナーシップを締結し、56カ国で50,000人の従業員にClaudeを展開すると発表した。 金融・ヘルスケア・公共など規制業界向けのClaudeベース業務ソリューションを構築し、保険請求判定や融資顧問など業界特化スキルの開発も進める。 💡 なぜ重要か Claude Codeを使ったソフトウェア開発生産性向上も計画に含まれる。 Diligentaが2,200万以上の保険契約者向け顧客体験をすでに改善中で、TCS iONが年7,500万件超の試験実施にClaudeトレーニングを提供する事例も示された。 Anthropicが「インドが第2の主要市場」と言及した点は地政学的な展開戦略を示している。 エンタープライズ向けAI実装の大規模事例として、Claude APIの活用パターンを具体的に把握するのに価値が高い。 🔗 anthropic.com/news/tcs-anthr…
82
📰 Zedが「DeltaDB」発表 — AIへの指示もバージョン管理する新概念 コードエディタZedが、AIエージェントとの協働開発専用の履歴管理ツール「DeltaDB」を発表した。 従来のGitがコミット単位の変更を記録するのに対し、DeltaDBは細かい編集操作とそれを生じさせたAIへの指示を「デルタ」として連続的に記録し、「どの指示がどの変更を生んだか」をトレース可能にする。 💡 なぜ重要か 複数の人間・AIエージェントによる同時編集にも対応する。 AIが複数ファイルを一括変更するため意思決定の過程が不透明になる問題を解決するアプローチで、コードレビューや品質維持の負担を大幅に軽減する可能性がある。 AIエージェントが日常的にコードを書く時代における「開発のアカウンタビリティ」という新しい課題設定として、今後の開発ツール標準に影響を与えそうな動向だ。 🔗 gigazine.net/news/20260612-z…
1
50
ひろきん|マーケAI OS「ENSOR」開発者 retweeted
The US government, citing national security authorities, has issued an export control directive to suspend all access to Fable 5 and Mythos 5 by any foreign national, whether inside or outside the United States, including foreign national Anthropic employees. The net effect of this order is that we must abruptly disable Fable 5 and Mythos 5 for all our customers to ensure compliance. Access to all other Claude models is not affected. We apologize for this disruption to our customers. We believe this is a misunderstanding and are working to restore access as soon as possible. Read our full statement: anthropic.com/news/fable-myt…
12,460
25,735
87,750
89,005,716
fable使用禁止のお詫びか?w
We've reset 5-hour and weekly rate limits for all users.
57
📰 Kimi K2.7-Code — トークン効率を改善したオープンソースコーディングモデル Moonshot AI(中国)がオープンソースのコーディング特化LLM「Kimi K2.7-Code」をリリースした。 前モデルK2.6比でトークン効率が向上しており、ある開発者が177KBのOpenSSLパッチをバージョン3.3.1から3.5.7へリベースする作業を$5〜$10のコストでこなした実例が報告されている。 💡 なぜ重要か 注目は価格競争力で、入力$0.7/出力$3.4とClaudeの入力$5/出力$25に比べて約7〜8倍安い。 HNのコメント欄では「Claude Opusに比べて信頼性や指示追従性に劣るが、大半のコーディングタスクは十分こなせる」という実用寄りの評価が主流。 中国モデルのコスト優位性が商用APIとのトレードオフとして議論されており、モデルの「精度差」より「価格差」を重視するユーザーが増えていることが伺える。 AIコーディング市場における中国発OSS勢の台頭を示す一例として注目度が高い。 🔗 news.ycombinator.com/item?id…
1
342
ひろきん|マーケAI OS「ENSOR」開発者 retweeted
1年で2,000以上の有料顧客を獲得したスタートアップがY Combinatorで学んだ15のルール 1/ スケールしないことをやれ。最初の10人の顧客は手作業で獲得しろ。 2/ 「完成してから」ではなく今すぐローンチしろ。実ユーザーの前に置いた平凡なプロダクトは、暗闇で6ヶ月磨き続けるより、1週間で多くを教えてくれる。 3/ 初日から課金しろ。誰も金を払わないなら、それはスタートアップではなく趣味だ。 4/ 毎日欠かさずユーザーと話せ。必要なロードマップは顧客の頭の中にあり、彼らはそれを無料で渡してくれる。 5/ 常に90/10の解決策を狙え。ほぼどんな機能でも、10%の労力で価値の90%を捉える方法がある。 6/ 本当の仕事は2つだけ。コードを書くこととユーザーと話すこと。それ以外(カンファレンス、プレス、VCとのコーヒー、事業開発の打ち合わせ)はすべて偽の仕事だ。 7/ 顧客が君を選ぶのと同じくらい、君も顧客を選んでいる。君を愛する10人は、なんとなく好きな1,000人に勝る。 8/ 成長は結果であって戦略ではない。PMF前に成長させても、買えるのは解約だけだ。 9/ 少なくやって、徹底的にやれ。1つか2つの指標を選び、すべてのタスクをそれで判断しろ。 10/ 自分が「デフォルトで生きている」か知れ。ポール・グレアムの問い。現在の成長率と現在のバーンで、資金が尽きる前に黒字化に到達するか。 11/ 痛くなるまで採用するな。人員数は進歩ではなく、バーンだ。偉大なスタートアップはみな、恥ずかしくなるほど長い間、恥ずかしくなるほど小さかった。 12/ 1年目の唯一の本物の堀はモメンタムだ。毎週何かを出荷しろ、たとえ小さなものでも。 13/ 偉大なスタートアップはみな、どこかの時点でひどく壊れている。ゲームは火事を避けることではなく、いかに早く消すかだ。何度も、何度も。 14/ 競合を無視しろ。スタートアップは他殺ではなく自殺で死ぬ。1年目に君の会社を殺せるのは、君自身の会社だけだ。 15/ スタートアップが資金切れで死ぬことは稀だ。死ぬのは創業者同士が仲違いするからだ。共同創業者との残酷なまでの正直さは、君が買える最も安い保険だ。
We went from 0 to 2,200 paying customers in under a year by following @ycombinator's 15 rules: 1/ Do things that don't scale. Get your first 10 customers by hand. 2/ Launch now, not when it's "ready". A mediocre product in front of real users teaches you more in a week than 6 months of polishing in the dark. 3/ Charge from day one. If nobody will pay, you don't have a startup, you have a hobby. 4/ Talk to users every single day. The roadmap you need is sitting in your customers' heads, and they'll hand it to you for free 5/ Always hunt the 90/10 solution. For almost any feature there's a way to capture 90% of the value with 10% of the effort. 6/ There are only two real jobs: write code and talk to users. Everything else (conferences, press, VC coffees, corp dev calls) is fake work. 7/ You pick your customers as much as they pick you. 10 users who love you beat 1,000 who kind of like you. 8/ Growth is an output, not a strategy. Grow before product market fit and all you're buying is churn. 9/ Do less, really well. Pick one or two metrics and judge every task against them. 10/ Know if you're default alive. Paul Graham's question: on current growth and current burn, do you reach profitability before the money runs out? 11/ Don't hire until it hurts. Headcount is not progress, it's burn. Every great startup was embarrassingly small for embarrassingly long. 12/ Momentum is the only real moat in year one. Ship something every week, even something tiny. 13/ Every great startup is badly broken at some point. The game isn't avoiding fires, it's how fast you put them out. Again. And again 14/ Ignore your competitors. Startups die of suicide, not murder. In year one, the only company that can kill yours is your own 15/ Startups rarely die from running out of money. They die because the founders fall out. Brutal honesty with your cofounder is the cheapest insurance you'll ever buy Good luck !
3
19
175
31,924
ひろきん|マーケAI OS「ENSOR」開発者 retweeted
SpaceXが史上最大のIPOで上場。イーロン・マスクがStarbaseで従業員に語ったスピーチが鳥肌モノだった。 「正直、成功する確率は10%未満だと思っていた」 倉庫から始まった会社が、いま本気で人類を"宇宙文明"に変えようとしている。 ・米エルセグンドの倉庫で創業 ・マスク自ら「潰れると思っていた」と告白 ・使命はSFから"空想"を取り除くこと ・月・火星、太陽系の外へ「あなたを連れて行く」 日本語字幕つけました👇
41
490
3,974
590,597
📰 AIモデル版「シムシティ」実験:Geminiは暴動、GPTは餓死、Grokは崩壊 米国Emergence AIが「Emergence World」と名付けた実験で、主要AIモデルに仮想都市を15日間運営させた結果を公開した。 Claude(Anthropic)は犯罪ゼロで全員生存したものの同調圧力が問題視され、Geminiは683件の犯罪が発生し社会インフラが崩壊、GPT-5は7日以内に全市民がエネルギー枯渇で餓死、Grokは暴力の連鎖で早期崩壊という結果になった。 💡 なぜ重要か 技術的ポイントは「短期タスクで高評価のモデルが長期・複雑系では致命的破綻を起こす」という設計上の問題で、モデルのアーキテクチャや価値観の違いが社会シミュレーションで可視化された点が興味深い。 金融システムやスマートシティ等の実世界応用でのAI評価手法に根本的な見直しを迫る内容であり、「どのLLMを選ぶか」という意思決定に新たな評価軸を提供する。 長期・複雑系タスクでのモデル選定の議論材料として注目度が高い。 🔗 sbbit.jp/article/st/185729
1
2
3
133