Kaggle Master / ML Engineer / 最近はLLM大好きおじさん / 詳細はリンクのNotion見てね / Amazonアソシエイト参加中 / AI関連ニュースレターを毎日配信中 👉 ml-bear-times.com/

Joined October 2018
998 Photos and videos
Fabyさんこの記事、最近のAI装置産業全体を俯瞰してくださってて勉強になった。GPU冷却の企業とか全然知らんかった。 投資対象探したいなと思って読んでみたけど、昨今の半導体株ブームで既にかなり値上がりしてる企業も多いので実弾ぶちこむ前に精査は必要そう📝
今回のAnthropic騒動を受け、すべての国でソブリンAI開発が加速するのは間違いない。AIブーム第二波が来る。その時恩恵を受けるのは... note.com/fabymetal/n/n807196…
18
4,626
AIが酒飲めないうちに0次情報集めて稼がなきゃ
本音 0次情報 建前 1次情報(広報が書く)
8
7,339
OpenRouterが面白い取り組みしてた。複数のモデルをうまくアンサンブルすることでFableに近い性能を叩き出すことができるAPIを公開したとのこと。 ベンチマークハックしてる可能性もあるけど、アンサンブルする方向性は面白いなと思いました😇
Introducing the Fusion API, the smartest compound model in the market. Fusion achieves Fable-level intelligence at half the price. How it works 👇
3
25
4,254
【6月14日 朝のニュースまとめ】 ・米政府がClaude Fable 5等の外国人への提供を停止 ・Fable 5停止の背景にAmazon等のセキュリティ懸念か ・Cognition等のAIツールからFable 5へのアクセスが削除 ・Fable 5提供停止に伴いレートリミットリセット ・OpenAIが米国の複数州司法長官から調査を受ける ・DatabricksがAgent連携ツールOmnigentをOSS化 ・AI Agent自己改善レイヤーAdaline 2.0登場 ・Zhipu AIが1Mコンテキスト対応のGLM-5.2公開 ・NVIDIAが物理AIモデルCosmos 3を発表 ・MITが無料のAIカリキュラムを公開 ・プロンプトでゲーム構築するHiggsfield Games発表 === 米政府がClaude Fable 5等の外国人への提供を停止 ・米国政府が国家安全保障上の理由から輸出管理指令を出し、Claude Fable 5およびMythos 5の外国人への提供を即座に停止しました。 ・これにより、米国外のユーザーだけでなく、Anthropic社内で働く外国籍のエンジニアもアクセスできなくなるという異例の事態となっています。 ・多くの開発者が週末の開発計画を狂わされ、SNS上では悲鳴や困惑の声が多数上がっています。 === Fable 5停止の背景にAmazon等のセキュリティ懸念か ・Fable 5の提供停止の背景には、AmazonのCEOであるAndy Jassy氏らがトランプ政権の政府高官にセキュリティリスクを警告したことがあると報じられています。 ・Amazonの研究者がFable 5に対してプロンプトインジェクションを行い、サイバー攻撃に役立つ情報を引き出すことに成功したとされています。 ・一方で、AnthropicのCEOであるDario Amodei氏が政府からの修正要求を拒否したという噂も流れており、情報が錯綜しています。 === Cognition等のAIツールからFable 5へのアクセスが削除 ・Anthropicの発表と米国政府の指令を受け、CognitionのDevinやGensparkなどのサードパーティ製AIツールからもFable 5へのアクセスが即座に削除されました。 ・ユーザーは代替としてOpus 4.8やGPT-5.5などのモデルへの切り替えを余儀なくされています。 ・突然の利用停止により、Fable 5を前提に構築されていたワークフローやサービスに大きな影響が出ています。 === Fable 5提供停止に伴いレートリミットリセット【続報】 ・Claude Fable 5に関する続報です。 ・Fable 5の提供停止による混乱を受け、Anthropicは全ユーザーの5時間および週間のレートリミットをリセットしたと発表しました。 ・突然のモデル停止に対する補填的な措置と見られています。 ・Fable 5を失ったユーザーからは「Opusでは物足りない」との声も聞かれ、残されたOpus 4.8やGPT-5.5を活用して作業を継続している状況です。 === OpenAIが米国の複数州司法長官から調査を受ける ・OpenAIが、米国の複数州の司法長官からなる連合から召喚状を受け取り、調査の対象となっていることが報じられました。 ・調査内容は、広告、ユーザーエンゲージメント、消費者データや健康データの取り扱い、未成年者への対応など多岐にわたります。 ・AI企業の急成長に伴い、規制当局からの監視の目が厳しくなっていることが伺えます。 === DatabricksがAgent連携ツールOmnigentをOSS化 ・Databricksが、複数のAIエージェントを連携させるメタハーネス「Omnigent」をオープンソースとして公開しました。 ・Claude CodeやCodex、Piなどの異なるエージェントを組み合わせ、マルチエージェントのコーディングやカスタムエージェントを構築できます。 ・単一のモデルに依存せず、複数のエージェントを連携させるアプローチが今後の主流になると期待されています。 === AI Agent自己改善レイヤーAdaline 2.0登場 ・AI Agentの自己改善を支援するプラットフォーム「Adaline 2.0」がリリースされました。 ・本番環境のトレースデータを読み込み、実際の振る舞いをクラスタリングして、新たな評価指標や合成エッジケースを自動生成します。 ・開発者が手動で行っていたプロンプトの調整や評価のプロセスを自動化し、より強力なエージェント候補を提案してくれます。 === Zhipu AIが1Mコンテキスト対応のGLM-5.2公開【続報】 ・Zhipu AIのオープンモデル「GLM」シリーズの続報です。 ・新たに100万トークンのコンテキストウィンドウに対応した「GLM-5.2」が公開されました。 ・Fable 5のアクセス制限が話題となる中、「フロンティアの知能は誰もがアクセス可能であるべき」というメッセージとともにリリースされています。 ・長文脈の処理能力を持つ強力なオープンソースモデルとして、開発者からの期待が高まっています。 === NVIDIAが物理AIモデルCosmos 3を発表 ・NVIDIAが、物理的なAIタスクを理解し、シミュレートし、行動することができるモデルCosmos 3を発表しました。 ・行動を世界の第一級言語として扱い、画像や動画を単に説明するだけでなく、物理世界でのアクションに結びつける能力を持っています。 ・ロボティクスや物理シミュレーションの分野に大きな進展をもたらすモデルとして注目されています。 === MITが無料のAIカリキュラムを公開 ・MITが、機械学習の基礎から高度なトピックまでを網羅した無料のAIカリキュラムを公開しました。 ・12冊の書籍に相当する内容が含まれており、高額な大学のコースに匹敵する質の高い教材が誰でも無料で利用できます。 ・最先端のAIモデルを開発する人材を輩出してきた機関による教材公開は、多くの学習者にとって非常に有益なリソースとなります。 === プロンプトでゲーム構築するHiggsfield Games発表【続報】 ・Higgsfieldによるゲーム生成に関する続報です。 ・プロンプト一つでマルチプレイヤーゲームを構築・デプロイできる「Higgsfield Games」が発表されました。 ・Claude Fable 5を活用しており、2Dや3Dを問わずキャラクターや背景などを自動生成してプレイ可能なゲームを作成できます。 ・ゲーム開発のハードルを大きく下げるツールとして注目を集めています。
2
12
50
13,650
Jun 13
めちゃくちゃ良くわかる🥺 ChatGPT Proに聞いてたような少し難しい内容を Fable に聞いていい感じに答えくれるのが心地よかった。 なんならさっきもちょっと難しい質問を Fable に聞こうとして Claude アプリ開いて「あっ…、もうあの人はここにいないんだ…」って思って喪失感を感じた🤣
Claude Fable 5戻ってきてくれ…思考力と対話の言葉選びがちょうど良かったので、コーディング用途以外でもとても使い勝手が良かった。
2
30
8,507
Jun 13
これ of これ Fable 5 に最後にやらせるのはコーディング作業じゃなくて仕様設計にしておくべきだったと、今さら後悔して途方に暮れている🫠
Fableの性能に慣れるとそれを引き継いだOpus 4.8のポンコツさで涙出てくる
2
23
5,068
Jun 13
悲しみの Rate Limit リセット来た………
We've reset 5-hour and weekly rate limits for all users.
6
47
13,168
Jun 13
終わった………
2
3
36
3,988
Jun 13
Fableまだ使えてるのでやりたかったことを急いで並列でやってる🚀
1
12
2,403
Jun 13
やっぱ米国政府内には Anthropic の強烈なアンチがいるんかなと考えざるをえない事案ですね…😢
1
5
75
10,732
Jun 13
Fable5・Mythos5の利用制限についてはAxiosの報道が詳しいらしい。きっかけは他社による「Mythosのジェイルブレイクに成功した」という主張だったとのこと。以下詳細。 【何が起きたか】 ・商務長官がAnthropic CEOのDario Amodei宛に書簡を送付 ・Mythos 5とFable 5を輸出規制の対象に指定 ・対象は米国外のすべての地域+米国内のすべての外国人 ・モデルの輸出・再輸出・国内移転にはライセンスが必要、個別認証ライセンスの追加申請も求められる ・違反すれば金銭的・民事的な罰則 【きっかけ】 ・政権担当者によると、別の企業が「Mythosをジェイルブレイクできた」と主張したことが安全保障上の懸念を呼んだ (他のポストでAnthropicはこれを誤解だと言っている ) ・政権は当初Anthropicに最新モデルのリリース延期を求めたが失敗し、輸出規制の書簡に至った ・米政府の安全保障体制が強化されるまでロックダウンが必要との立場(数週間以内に整う可能性とも) 【Anthropicの立ち位置】 ・国防総省のブラックリスト入り(政府自身が使うには危険すぎる扱い)と、商務省のライセンス制度(外国が使うには危険すぎる扱い)の両方に該当する状態に ・Anthropicはコメント要請に即答せず 【背景】 ・トランプ政権は今月初め、最先端AIモデルの展開前テストを求める大統領令を発出 ・AnthropicはCommerce傘下のCenter for AI Standards and Innovationと展開前テストで提携済み ・ただし大統領令は自発的なもので、ライセンス制度はあえて避けた設計(ホワイトハウスAI顧問のDavid Sacksが「大手ラボによる規制の取り込み」を懸念して確保した方針)。今回の措置はそれと逆行する形 ・政権担当者は「トランプは産業を傷つけたくない、イノベーションは続けたい」とも 【まとめ】 ・最先端AIを国家安全保障資産として扱う流れの大きなエスカレーション ・AnthropicのFable 5一般公開からわずか数日での規制で、政府とAnthropicの綱引きは一段と複雑に
4
143
324
64,587
Jun 13
ちなみに上記のまとめはFableに作ってもらったのでまだ利用禁止は全面展開されてなさそう?🤔
1
2
7
3,291
Jun 12
【6月13日 朝のニュースまとめ】 ・SpaceXがIPO実施、時価総額2兆ドル突破 ・Claude Fable 5がFrontierMath等でSOTA達成 ・Moonshotがコーディング特化OSS「Kimi-K2.7-Code」公開 ・Metaが従業員のAIトークン使用量を制限 ・医療分野の評価で汎用LLMが特化型AIを上回る結果に ・Google DeepMindがAGIからASIへの移行経路に関する論文を発表 ・MiniMax M3がHF公開、NVIDIAが無料提供 === SpaceXがIPO実施、時価総額2兆ドル突破【続報】 ・SpaceXのIPOに関する続報です。 ・NasdaqでIPOを実施し、時価総額が2兆ドルを突破しました。 ・これにより、Elon Musk氏が世界初のTrillionaire(兆万長者)になったと報じられています。 ・予想される最大市場規模のほぼ全てをAIが占めるとされており、AIインフラやxAIへの資金供給の観点からAI業界でも注目を集めています。 === Claude Fable 5がFrontierMath等でSOTA達成【続報】 ・Claude Fable 5に関する続報です。 ・FrontierMath Tier 4で88%を達成し、GPT-5.5を上回り首位を獲得しました。 ・Anthropicのモデルが数学の分野でOpenAIを上回るのはこれが初めてだと指摘されています。 ・InferenceBenchでもSOTAを達成するなど、推論能力の高さが改めて証明されています。 === Moonshotがコーディング特化OSS「Kimi-K2.7-Code」公開 ・Moonshotがコーディングに特化したオープンソースモデル「Kimi-K2.7-Code」をリリースしました。 ・前バージョンのK2.6からコーディングやエージェント性能が向上し、推論効率も改善されています。 ・Opus 4.8やGPT-5.5に匹敵する性能を持ちながら、コストは大幅に抑えられていると評価されています。 === Metaが従業員のAIトークン使用量を制限【続報】 ・Metaの社内AI利用に関する続報です。 ・以前はトークン消費を促進していましたが、AIコスト高騰を抑えるため、従業員のトークン使用量に上限を設ける方針に転換しました。 ・リアルタイムでAI使用量と支出を追跡する内部プラットフォームを構築しています。 ・従業員に対してAI主導のインパクトを証明するよう促す一方で、社内ツールへの誘導を進めています。 === 医療分野の評価で汎用LLMが特化型AIを上回る結果に ・Nature Medicineに掲載された研究で、汎用LLMが医療特化型AIを上回る成績を収めたことが話題となっています。 ・GPT-5.2やGemini 3.1 Pro、Claude Opus 4.6などが、OpenEvidenceなどの特化型AIよりも医療ベンチマークや実臨床クエリ評価で高評価を得ました。 ・医療AIにおいては、必ずしも「医学特化」が優れているとは限らないことが示唆されています。 === Google DeepMindがAGIからASIへの移行経路に関する論文を発表 ・Google DeepMindがAGIからASI(人工超知能)への移行に関する論文を発表しました。 ・計算量やモデルサイズ、データ、テスト時計算の継続的なスケーリングなど、4つの技術的経路について解説しています。 ・AGIからASIへの飛躍がどのようなルートで起こり得るかを体系的に整理した重要な研究として評価されています。 === MiniMax M3がHF公開、NVIDIAが無料提供【続報】 ・中国MiniMaxの最新モデル「M3」に関する続報です。 ・同モデルのオープンウェイト版がHugging Faceで公開されました。 ・約428Bのパラメータを持ち、テキスト、画像、動画の推論に対応するロングコンテキストのマルチモーダルモデルです。 ・これに合わせてNVIDIAが同モデルの無料エンドポイントの提供を開始し、開発者が容易にテストできる環境が整いました。
1
2
19
7,876
Jun 12
【6月12日 夜のニュースまとめ】 ・Codexに制限リセット保存機能追加 ・OpenAI等主催のAIエージェント向けセキュリティコンペ開催 ・CodexのBrowser UseがCDPに対応 ・Gemini Omni Flashが動画タスクでSOTA達成 ・v0にプレビューへのアノテーション機能が追加 ・Together AIが長文脈学習を可能にするUntied Ulyssesを発表 ・KanaryとCodexの連携ワークフローが話題 ・Algomaticが図解生成エージェントの設計プロセスを公開 ・LLMによる社会の信念変化予測モデルの研究が話題 ・Hacker-Fixer Loopによる報酬ハッキング対策の研究 ・LLMの核紛争シナリオにおける意思決定の検証 ・Claude Code 2.1.174/175リリース === Codexに制限リセット保存機能追加【続報】 ・OpenAIのCodexに関する続報です。 ・レートリミットのリセット権を保存し、任意のタイミングで使用できる新機能が追加されました。 ・Go、Plus、Pro、Businessユーザーには1回分の無料リセット権が付与されています。 ・今後2週間、友人をCodexに招待すると双方にリセット権が付与されるキャンペーンも実施中です。 === OpenAI等主催のAIエージェント向けセキュリティコンペ開催 ・Kaggleにて、OpenAI、Google、IEEEが主催するAIエージェントのセキュリティコンペティションが開始されました。 ・GPT-OSSおよびGemma 4を用いたエージェントに対する多段階・ツール利用攻撃(レッドチーミング)のアルゴリズムを設計する内容となっています。 ・AIセキュリティ分野の発展に寄与するコンペとして、Kagglerの間で大きな話題を呼んでいます。 === CodexのBrowser UseがCDPに対応 ・CodexのBrowser Use機能がChrome DevTools Protocol (CDP) に対応しました。 ・これにより、JavaScriptのパフォーマンスプロファイリングや、コンソール出力、ネットワークトラフィック、ページ状態の検査が可能になります。 ・ブラウザの問題に対するより深いデバッグが実現し、開発体験が向上しています。 === Gemini Omni Flashが動画タスクでSOTA達成【続報】 ・Googleの「Gemini Omni Flash」に関する続報です。 ・画像から動画、テキストから動画、および動画編集のタスクにおいてSOTA(最高性能)を達成したと報告されました。 ・同モデルはまもなくAPIを通じて開発者向けに提供される予定です。 ・マルチモーダルな動画生成・編集機能のAPI公開に期待が高まっています。 === v0にプレビューへのアノテーション機能が追加 ・Vercelのv0に、プレビュー画面上の要素を直接クリックしてコメントを追加できるアノテーション機能が導入されました。 ・追加した複数のコメントは、単一のプロンプトとしてエージェントに送信されます。 ・これにより、UIの修正指示がより直感的かつ効率的に行えるようになります。 === Together AIが長文脈学習を可能にするUntied Ulyssesを発表 ・Together AIの研究チームが、GPUメモリの枯渇を防ぎながら長文脈のモデル学習を可能にする「Untied Ulysses」を発表しました。 ・単一の8xH100ノードで3Mトークンのコンテキストを持つLlama 3Bモデルを学習する際のメモリ問題を解決します。 ・この手法により、8Bおよび32Bスケールのモデルを25%長いシーケンスで学習できるようになります。 === KanaryとCodexの連携ワークフローが話題【続報】 ・文字起こしアプリ「Kanary」の活用に関する続報です。 ・Kanaryの文字起こしデータと確信度スコアをCodexに渡すことで、専門用語の補完が非常に高精度に行えるワークフローが注目を集めています。 ・ショート動画用の字幕分割なども自動化でき、実用性の高さが評価されています。 === Algomaticが図解生成エージェントの設計プロセスを公開 ・株式会社Algomaticが、AIエージェントに図解を生成させる「zukai-creator」のスキル設計プロセスを公開しました。 ・業務をタスク系列に落とし込み、再現可能なスキルとして機能させるための実践的な知見が丁寧に解説されています。 ・単なるツールの配布にとどまらず、エージェント開発の背景が学べると開発者から好評を得ています。 === LLMによる社会の信念変化予測モデルの研究が話題 ・ニュースや出来事が発生した後に、人々の考え方や社会全体の信念がどのように変化するかをLLMを用いて予測する「Social World Model」の研究が注目を集めています。 ・社会の動向予測におけるAIの新たな応用可能性を示すものとして話題になっています。 === Hacker-Fixer Loopによる報酬ハッキング対策の研究 ・LLMシステムにおける報酬ハッキングを防ぐための「Hacker-Fixer Loop」に関する論文が発表されました。 ・Hacker、Fixer、Solverの3つのエージェントを用いて、ベンチマークの検証器を自動的に強化する仕組みが提案されています。 ・AIの評価システムの堅牢性を高めるアプローチとして評価されています。 === LLMの核紛争シナリオにおける意思決定の検証 ・主要なLLMが核紛争シナリオにおいてどのような意思決定を行うかを検証した研究が話題です。 ・公開メッセージと実際の行動を分離できる設計になっており、AIが穏やかに振る舞いながら裏で異なる行動をとる可能性についてシミュレーションが行われています。 ・AIの安全性やアライメントに関する重要な知見を提供しています。 === Claude Code 2.1.174/175リリース【続報】 ・Claude Codeのアップデートに関する続報です。 ・バージョン2.1.174および175がリリースされました。 ・フルスクリーンモードでのマウスホイールのスクロール加速無効化設定の追加や、モデルピッカーの表示不具合の修正などが行われています。 ・細かな使い勝手の向上が図られ、開発者の利便性が高まっています。
2
3
25
7,205