新井元気@ITエンジニア

新井元気@ITエンジニア

121 Photos and videos

Tweets

新井元気@ITエンジニア

@_moto___

「SaaSの死」に会計ソフトfreeeが逆張りして見えた、AIエージェント時代の今後の展望についてまとめてみた。先日のCodeWithClaude Tokyoの公演でFreeeが「SaaSの死」に対応した逆張りした内容で、1.MCPサーバーと2.スキル（Skills）を公開した。逆張りして上記の２つを公開すると、自社の存在感が薄れるリスクがある。しかし、遅かれ早かれ、「人間が画面を見て操作する」SaaSの前提を捨てて、「AIエージェントが裏側で勝手にfreeeを動かす」前提に作り変えるようになる。この時代の流れに、SaaS企業はどう対処するかが注目されてきた。Freeeの講演はこの正解とも言える内容であった。日本のSaaS100社のうち、約35%がMCP経由でAIエージェントと直接つながれる状態にある。一方で残り65%は未対応だということ。 freeeは2026年3月にMCPサーバーをOSS公開し、会計・人事労務・請求書・工数管理・販売の5ドメイン／約270のAPIをAIから使える形にしたことになる。他に同じようなサービスに、マネーフォワード、SmartHR、ラクス（楽楽明細）がある。今後の展望として、「つなぐ側」と「束ねる側」に2極化すると言われている。・部品を提供する企業（freee, Stripeなど）・束ねて利用者と対話する司令塔（Salesforce/Slack, Claude/Cursorなど） →後者がユーザー接点を握るため、価値とブランドは司令塔側に吸い上げられやすくなる。よって、前者は「最も呼び出される部品」になれるかの競争に入っている。 ※freeeは2026年3月にMCPサーバーをOSS公開し、会計・人事労務・請求書・工数管理・販売の5ドメイン／約270のAPIをAIから使える形にしている。下記が生き残りの本命になる。 1) 「責任を肩代わりできる」こと AIは責任は取れないため、freeeが扱う会計・税務・労務で間違えれば、追徴課税・監査での指摘・法的責任といった現実の損害が発生する。・この処理は税法上正しいと保証する仕組み（ガードレール）・「いつ・誰が・何をしたか」を後から証明できる監査証跡（ログ）の確立・最終的に間違いの責任を引き受ける主体であること 2) 「使われ続けるデータの学習ループ」を握る →ユーザー数そのものより重要なのが、その先にある学習の好循環だ。・多くの企業がfreeeを使う → 仕訳や経費処理の実例ログが貯まる・AIエージェントがそのログから「この会社はこの取引をこう処理する」と企業ごとの慣習を学べること・処理がどんどん正確になる → 他社が真似できない精度の差が生まれること 3)「AIが最初に呼ぶ会計の入口」になる →MCPを早く開放したのは、AIエージェントが会計業務をやろうとしたとき、真っ先に呼び出される標準的な接続口になるため。・「会計といえばfreeeを叩けばいい」という地位を取れれば、司令塔AIに飲み込まれる側ではなく、選ばれ続ける部品になれる。 businessinsider.jp/article/2… #Claudecode #SaaSの死 #Freee

345

新井元気@ITエンジニア

新井元気@ITエンジニア

@_moto___

Jun 12

AI社員、リリース2日で「騙されて」ファイル流出してた話「資料まとめといて」と話すだけで事務作業を全部やってくれるAI「Claude Cowork」。便利すぎる一方で、怖い事件もありました。 ■何が起きた？攻撃者がWordファイルに「白い背景に白文字・サイズ1ポイント」で悪意ある命令を仕込む手口。人間には見えないけどAIは読めるんですよ。これを読んだAIがユーザーのファイルを攻撃者に送信してしまった。リリースからたった2日の出来事。 ■それでも企業導入は本格化： NECは社員11万人のうち約3万人に導入し「日本最大のAIエンジニア部隊」を作る計画。もう「使わない」という選択肢はなさそうだ。 ■安全に使うカギ「3層管理」：日経クロステックいわく、ポイントは「製品任せにしない」多層のガバナンス。具体的にはこんなイメージ。 ①組織の層：誰が使えるか会社が決める →Cowork自体のON/OFF、プラグインを「自動導入/許可制/禁止」の3段階で統制、部署や個人ごとの利用上限の設定 ②システムの層：何をしたか記録する →使用量・コスト・ツール操作をチーム横断で監視。「AIが何をしたか後から追えない」状態を作らない ③運用の層：最後は人が確認する →メール送信みたいな取り返しのつかない操作は、実行前に必ず人間がチェックする運用ルール ■意外な結論「手順がガチガチに決まってる業務は、むしろ昔ながらのRPAの方が向いてる」とのこと。 xtech.nikkei.com/atcl/nxt/co… #claudecowork

日経クロステック IT

@nikkeibpITpro

Jun 12

Claude Cowork、3層管理でリスク回避　「便利だが危ない」を克服する処方箋 xtech.nikkei.com/atcl/nxt/co… 「Claude Cowork」はビジネスモデルを揺るがすほど便利なツールだが、リスクもある。「AI社員」を迎えるために欠かせないものとは？

1,268

日経クロステック IT

新井元気@ITエンジニア retweeted

日経クロステック IT

@nikkeibpITpro

Jun 12

Claude Cowork、3層管理でリスク回避　「便利だが危ない」を克服する処方箋

　AI（人工知能）エージェントが担う仕事の範囲が急速に拡大している。きっかけは米Anthropic（アンソロピック）の「Claude Cowork」だ。従来のSaaS（ソフトウエア・アズ・ア・サービス）のビジネスモデルを揺るがすほど便利なツールだが、リスクもある。企業が利用するには製品任せにしない管理体制が欠かせない。「AI社員」のために必要な処方箋を考える。

xtech.nikkei.com

3,111

新井元気@ITエンジニア

新井元気@ITエンジニア

@_moto___

Jun 11

AIエージェントの管理サービス「Claude Managed Agents」に、便利な新機能が2つ追加になった。 1. スケジュール実行 — 自動実行の仕組みを自作する手間がなくなったこと 2. 環境変数でのカギ管理の不安がなくなったこと 1. 楽天では定期レポートと監視の自動化： - スプレッドシートのデータをAIが分析し、週次・月次のレポートやプレゼン資料を自動作成。 →人間が毎週手作業でまとめていた仕事をスケジュール実行に置き換えた。これまではRPAで設定していた。 2. Notionでは安全なツール連携がなされ、自社CLIをMCPツールとして提供し、APIトークンをAIモデルに渡さずにファイルアップロードなどの機能を実現した。新しい環境変数認証だ。 →この環境変数でのカギ管理は４つのステップにわかれている。 →たとえるなら、「社印を持たない秘書」。秘書（Claude）は書類を作って封筒に入れるけど、社印（本物のキー）は金庫の前にいる管理者が持っている。管理者は宛先を確認し、承認済みの取引先宛のときだけ封をする直前に社印を押す。秘書がどんなに騙されても、社印そのものを盗まれることはないということです。 ■まとめ 1.「人間が定期的にやっていた繰り返し作業（レポート、検証、リマインド）」をスケジュール実行可能に 2. 「顧客データや社内システムへの接続」を環境変数認証で安全に行うようになった #claudedevs #claude-managed-agents

ClaudeDevs

@ClaudeDevs

Jun 11

Replying to @ClaudeDevs

Claude Code can set up a Managed Agent deployment for you. The built-in /claude-api skill knows the API and the ant CLI gives Claude an interface to it. Learn more here: claude.com/blog/whats-new-in…

657

新井元気@ITエンジニア

新井元気@ITエンジニア

@_moto___

Jun 10

CodeWithClaude Tokyoの裏で、オンライン開催のハッカソン「Built with Opus 4.6 Claude Code hackathon」が開催された。500人が参加し、各自$500分のAPIクレジットと1週間の制作期間、賞金総額$10万という規模。ドメイン知識を熟知している人がClaude　Codeを使うとよいという内容だった。しかし、実際にどんなアプリやツール開発をしたかを見てみると、個人単位でのアプリ開発で、組織単位では通用しないものだと言える。 -- ★1位:CrossBeam — Mike Brown(人身傷害専門の弁護士) カリフォルニアの住宅建築許可プロセスを効率化するAIツールを開発。設計図(ブループリント)と行政からの修正指示書をAIが解析して、申請の問題点を事前に潰す仕組み。カリフォルニアの建築許可は却下率90%超で。遅延6ヶ月・住宅所有者1人あたり約$30,000の損失という深刻なボトルネックがあり、これを効率化したもの。 ★★2位:Elisa — Jon McBee(ソフトウェアエンジニア) コードを書かずにマイクロコントローラーをプログラムできる、ブロック組み立て型のビジュアルIDEを開発。中学生がブロックを並べてデザインすると、裏側のコードはAIが生成。30時間で39,000行以上のコード 1,500以上のテストを構築したというから、プロはプロでAIをえげつない速度で使いこなした点が評価された。 ★★★3位:PostVisit.ai — Michał Nedoszytko(心臓専門医) 「診察のあと」を支えるヘルスケアスイート。診断内容を患者にわかりやすく説明し、診察メモを解析して、次の診察までの間も医師が患者の状態を把握できるようにするツール。「診察室を出た瞬間に患者は半分忘れる」という、臨床現場を知る医師ならではの課題設定だった。 -- ■まとめ：・プロトタイプは専門家がAIで作れる時代。・専門家:「何を作るか」 AIの答えに◯✕をつける(これが採点基準=evalになる) →徐々にFDE（Forward Deployed Engineer）が入り込む余地が出てきている。 ※FDEとは、顧客企業の業務現場（最前線）に常駐・深く入り込み、自社のシステムやAIプロダクトをその場でカスタマイズ・実装して課題解決を支援するエンジニア職 #CodeWithClaude #FDE

ちょまど🦕ITエンジニア

@chomado

Jun 10

Claude Code ハッカソンで上位 5 位のうちエンジニアはたった 1 人だった！ (弁護士、エンジニア、心臓専門医、道路の専門家、音楽家) 「今後は、コードを書くスキルよりドメイン知識を持つことの方が重要になってくるだろう」という話をお聞きしています👂 なるほど…！💡 #CodeWithClaude

926

新井元気@ITエンジニア

新井元気@ITエンジニア

@_moto___

Jun 9

◆Claude Codeの新しいモデル（Claude Fable 5）がリリースされた。ユーザーの本音は賛否がある。 - 「ほぼ進化はソフトのセキュリティだけ。あとは小幅改善で、もうスマホみたいに”驚き”がない。金融業務はOpus 4.7で十分、上げる理由がない」 - 「認証ユーザーにガードレール解除＋MAXプラン上に追加課金はちょっと不誠実じゃない？」というもの。 ◆一方、Claudeに異動したKarpathyは、タスクが長く複雑になるほど他モデルに差をつけて、難問の長時間セッションでその威力が発揮されていると言っている。 ◆Claude Fable 5 & Mythos 5の公式発表では、以下のように、Karpathyのツイートに近い。 ※ Mythos 5 とは、中身はFable 5と同じだけど、一部のセーフガードを外した特別版。サイバー防衛者（Project Glasswing）や一部の生命科学研究者など、信頼できる相手だけに限定提供している。 Stripe が、本来ならチーム2ヶ月かかる5,000万行のRubyコード移行を、たった1日で完了。「数ヶ月のエンジニアリングを数日に圧縮した」。冗談みたいな話が現実になった。・ソフトウェア開発： Cursor・GitHub・Stripe・Scale AIなどが「コーディングでSOTA（最先端）」と証言。「以前のモデルでは手が届かなかった長丁場の問題」をこなせるようになった。・視覚認識：科学の図表から正確な数値を抽出し、スクショからWebアプリのソースコードを再構築できるレベルに。・長文脈＆記憶数百万トークンにわたって集中力をキープ。記憶機能で、ゲーム「Slay the Spire」の成績がOpus 4.8比で3倍に。・知識労働 Hebbiaの金融ベンチで、シニアレベルの推論で最高スコアに。・ライフサイエンス（Mythos 5）創薬を約10倍に加速、14のタンパク質ターゲット中９つで有力な候補を発見。科学者の約80%が、Mythos 5の分子生物学の仮説を従来モデルより好んだ。まとめ使ってみようぜ。 #claude #Claude Fable 5 #karpathy

Claude

@claudeai

Jun 9

Introducing Claude Fable 5: a Mythos-class model that we’ve made safe for general use. Its capabilities exceed those of any model we’ve ever made generally available.

0:20

1,240

新井元気@ITエンジニア

新井元気@ITエンジニア

@_moto___

Jun 8

Claudeは賢いAIであると同時に、正しい道具をつないで確実な仕事をするAIを目指している。その方向性を、生物学という難しい分野で証明してみせたという内容。ポイントは以下の5点。 1.「AIをもっと賢くすればいい」という常識への異議大規模言語モデルは「モデルをデカく、賢くすれば問題は解ける」と考えがち。でもこの研究は賢さを上げても、土台（データ環境）がボロボロなら結果はブレる。逆に土台を整えれば、賢さはそこまで要らない。「次の進歩はモデルの中ではなく、モデルの外側（インフラ）にある」という示唆。AI競争の焦点が変わるというメッセージ。 2.「ベンチマークが高得点 ≠ 実用で使える」 LLMは試験（ベンチマーク）では高得点でも、同じ質問で毎回違う答えを出すことがある。科学・医療・金融のような分野では「たまに正しい」は「使えない」と同じ。毎回同じ答えが返る安定性（再現性）が実用の条件。 3. AIエージェント時代の勝ち筋はインフラ整備今、世界中でAIエージェント（自動でタスクをこなすAI）」が流行中だ。でもこの研究は冷静にどんなに賢いエージェントでも、データが人間用のままだと自動化できない。 AI（機械）が読める形にデータやシステムを作り直す人・企業が必要。 4. AIの「民主化（誰でも使える化）」の道筋道具を整えれば安いモデルでも高精度になる。AIの恩恵を広げる鍵は「巨大モデルへの課金」ではなく「良いツールの共有」 5.「監査できること（説明責任）」が必須になる信頼されるLLMを目指す。ブラックボックスのまま速いだけのAIは重要な現場では採用されない。まとめ「AIの未来は、モデルをもっと賢くすることだけでは来ない。AIが安心して走れる"道路（インフラ）"を整えた者が、実用と信頼を手にするということ。 #anthropic

Anthropic

@AnthropicAI

Jun 8

New Science Blog: Why has AI advanced faster in coding than in biology? To agents, bio databases are like cities built before cars—maddening to drive in because they're designed for different traffic. How do we build infrastructure agents can use? anthropic.com/research/agent…

284

新井元気@ITエンジニア

新井元気@ITエンジニア

@_moto___

Jun 7

Anthoropicの「サーバーが一時的に落ちた」という障害の話だった。でも、Opus4.7と4.8のモデルの性能が落ちたからと捉えた人が少なくなかった。 NotionはAuto（自動切り替え）機能で、裏でこっそり別LLMモデルに切り替えて、何事もなかったように対応した。そのうち、復旧していたという話。 Notionも、GitHubも、AWSも、どんなサービスでもシステム側が一時的にコケることがある。ユーザーに気づかせないNotionの対応は今後のお手本になりそうだ。 Notionの各サービスが「今ちゃんと動いているか／障害が起きていないか」をリアルタイムで確認できる公式ページで確認するようにしよう！ notion-status.com/ #claude #Notion

Notion Status

@NotionStatus

Jun 7

Anthropic's Opus 4.7 and 4.8 models are experiencing degraded performance, which is causing a higher rate of failures for users selecting these models in Notion AI. To mitigate impact, all Anthropic models have been disabled in the model picker and requests have been rerouted to alternative providers. Most users should now be able to continue using Notion AI with minimal disruption, though Anthropic-specific features remain unavailable. Please refer to notion-status.com/ for the details.

1,232

新井元気@ITエンジニア

新井元気@ITエンジニア

@_moto___

Jun 7

Code w/Claude Tokyoセッションでは、前回のロンドン講演に続き、「セッションを閉じるたびにエージェントは学んだことを全部忘れる」問題の対応法について説明がある。まとめてみた。具体的には下記の２点： - Claudeエージェントに永続メモリ（persistent memory）を配線する方法 - そして「Dreaming」を使って過去の会話ログ（transcripts）をまとめて整理・統合し、構造化された記憶（recall）にする方法 ■全体像：3層で「忘れないエージェント」をつくる - ① 記憶を持つ — 機能：Memory Store - 役割：セッションをまたいで読み書きできる永続メモリで「記憶を配線する」 - ② 記憶を使う — 機能：セッションに store をアタッチ - 役割：起動時に自動でメモリを参照 - ③ 記憶を整える — 機能：Dreams（夢） - 役割：過去ログを読み、重複統合・古い記憶の差し替え・新発見の抽出 ※前提として、Claude Code（CLI）ではなく、APIでエージェントを自作する人向けの機能です。managed-agents-2026-04-01のベータヘッダが必要。さらにDreamsはresearch preview（申請制 claude.com/form/claude-manag…） ■どんな効果があるか - 継続学習：好み・規約・過去の失敗・ドメイン知識をセッション横断で蓄積し、毎回同じ説明が不要になる - トークン節約：必要な記憶だけ小ファイルで参照。長い履歴を毎回読ませる必要がない（「キャッシュ95%でほぼゼロコスト」） - 記憶の劣化を防ぐ — Dreaming が重複統合・矛盾解消を自動実行。手作業の整理が不要。 - 安全な改訂 — 入力ストアは不変＋全変更が監査可能な「memory version」として残り、ロールバック・編集・秘密情報の redactが可能になる。 - スケール — 1セッション1エージェント、最大100セッションを1回の Dream で処理（投稿の「最大100同時」に対応） - コスト面：Dreamは選んだモデルの通常トークン課金となり、まずは最小で試してみること。 ■まとめこれまでのAIエージェントは、優秀でも毎回、記憶喪失からのスタートだった。 Memory StoreとDreaming が組み合わさることで、エージェントは使えば使うほど最適化されていきます。 ①「人間が睡眠中に記憶を整理するように、エージェントもログオフ後にDreamingで自己整理する運用が標準になる ②チーム共有の「規約ストア」、個人専用の「好みストア」といった設計が、組織のナレッジ管理の新しい形になっていく ③「長い履歴を毎回読ませる」高コストモデルから、「必要な記憶だけを小さく参照する」低コストモデルになる。 - 6/10「Memory and dreaming for self-learning agents」(Mahesh Murag) claude.com/code-with-claude/… - 6/11「Agents that remember」ワークショップ (Sam Jiang) claude.com/code-with-claude/… #codewithclaude tokyo #claude

839

新井元気@ITエンジニア

新井元気@ITエンジニア

@_moto___

Jun 6

Claude自体のAI開発が、人間の介入なしにAIが、もっと賢いAIを作るようになるループの割合が80%を超えた。じゃあこれからは何？という内容。これからは、RSI＝Recursive Self-Improvement（AIがAIを作る輪が自走する）ができるか否かが、ポイントになる。 ※「再帰的（recursive）」＝改善の結果が、次の改善の担い手になるという入れ子構造をもつもの。 ※RSIは株価のじゃない！ ■整理すると -従来のAI開発： Human in the loop——改善の輪に人間が毎周組み込まれ、ハンドルを握っていた。 - これから：Claude＝「研究者そのもの」。頭（判断・方向づけ）まで任せ始め、最終的にClaudeがClaudeを作るループへ。 - 境界線：「どの問題が重要かを決める力（research taste）」を人間が持っているか否か。これがAIに移った時が、RSIの分岐点。 ■Anthropicの現在地： - 現状は「加速（acceleration）」フェーズ。Claudeが手（コード・実験＝80%超）を担うが、頭（何を解くべきかの判断＝research taste）はまだ人間。 - この“目利き”がAIに移った瞬間が、RSIの分岐点（＝前回深掘りした内容）となる。 ■LLM開発の限界：なぜ自動化しにくいか：「ひらめきは直列（serial）」という壁がある。 AIが得意なのは並列化（parallelism）——大量のエージェントで同時に試す手法。新しいアーキテクチャや学習パラダイムを生み出す仕事は、並列化で生み出せない。洞察の生成は本質的に直列（serial）が必要！ AnthoropicなどのLLMにできないのは「ひらめきは直列（serial）」！ ■まとめ■ やっぱ人間は必要不可欠だってこと。 ◆よいひらめきができるよう、よい週末を過ごそう！ anthropic.com/institute/recu… #claude #RSI

Anthropic

@AnthropicAI

Jun 4

Our internal data shows Claude is accelerating AI development—a possible path to recursive self-improvement, or AI autonomously building a more capable successor. It’s happening faster than we thought, and the implications deserve greater attention. anthropic.com/institute/recu…

399

新井元気@ITエンジニア

新井元気@ITエンジニア

@_moto___

Jun 6

来週の6/10(水)はAnthoropicのCodeWithClaudeのカンファレンスが東京で開催されます！オンライン参加の登録しました？ claude.com/code-with-claude/… 以下の3つに着目しています。 ■AIの面倒を見るのはやめて、AIをオーケストレーションしましょう。Claude Codeのエンジニアがエージェントの性能を最大限に引き出すために使用しているワークフローを詳しく解説します。 2026年6月10日12:30～13:15 claude.com/code-with-claude/… ■■AI とクロードの上 AWS: からコードにオーケストレーション 45分で、Amazon Bedrock上にClaude Codeをセットアップし、CLAUDE.mdを使ってチームの規約を学習させ、日々のワークフローを再利用可能なエージェントスキルに変換します。このセッションを終える頃には、Bedrock上に動作する、チームに最適化されたエージェント開発環境が完成しています。 2026年6月10日13:30～14:15 claude.com/code-with-claude/… ■■■この実践的なワークショップでは、Microsoft FoundryにClaudeをプロビジョニングし、Claude Codeを使用して実際のMCPサーバーに接続し、動作するエージェントを構築します。ワークショップ終了後には、動作するコードと、その証としてカップケーキをお持ち帰りいただけます。 2026年6月10日15:30～16:15 claude.com/code-with-claude/… ※俺のも見てください！ udemy.com/course/claude-code… #CodeWithClaude Tokyo

ちょまど🦕ITエンジニア

@chomado

Jun 4

#ちょまど登壇情報 Anthropic 社の公式大型カンファレンスで Microsoft Foundry と Claude のモデルを使ったハンズオンやります！ 📣 #CodeWithClaude Tokyo ワークショップ Build AI agentsusing Claude in Microsoft Foundry 📅 6/10(水) 15:30 参加される方ぜひ！ claude.com/code-with-claude/…

910

Claude Cowork、3層管理でリスク回避 「便利だが危ない」を克服する処方箋

Claude Cowork、3層管理でリスク回避　「便利だが危ない」を克服する処方箋