Joined August 2007
190 Photos and videos
DigiSelfリリースしました! 写真1枚から本人と見分けがつかない動画を生成し、リアルタイム生成技術でAIアバターと対話もできます。 digiself.tech/ 10年前の創業以来、AIで人間の身体を再現することをやり続けてきましたが、ようやくこのクオリティに到達できたかと思うと感慨深いです。 弊社EmbodyMeの「Embody」という単語は、「具体化する」という意味でよく使われますが、元は「em body」で、精神に身体を与えるというのが語源。 魂や霊が人間の身体を持って現れる化身は、多くの宗教で見られる概念で、またギリシャ神話などでは、思想や理念に人間の姿を与えることが頻繁に行われ、それが「抽象的な概念を具体化する」という意味につながっていきました。 かつてはそれこそが、形のないものに対して、具体的な価値を持たせる手段だったのです。 今、AIの思考は人間を大きく越えようとしていて、AIが生成したコンテンツで世の中が溢れかえり、「美しさ」といった根本的な概念すら陳腐化させようとしています。 今こそ人間の原点に立ち返り、そうしたAIの思考や概念に身体性を持たせることが求められていると思います。 ・・・と、抽象的なことを色々書いてしましましたが、DigiSelfは、SNSやマーケティング、セールス、HRなどでの動画作成を劇的に簡単にしますし、店舗・受付・イベントなどでのデジタルサイネージや営業ロープレなどリアルタイムで対話するシーンでも多く活用でき、とても「具体的に」役に立つサービスですので、ぜひ使ってみてください!
映像生成AIのEmbodyMe、写真から動画生成 研修や広告向け nikkei.com/article/DGXZQOUC1…
3
14
147
11,437
イーロンの1年前のミーム投稿が、xAIの戦略そのものだと話題になっている。 GrokはLLM競争を加速させるための目くらましで、最初からデータセンター自体で利益を上げる戦略だったと。 AIの金になる木は、データセンター/半導体/電力で、ゴールドラッシュのツルハシに相当する。 LLMは本丸ではないと
ついに Google すら計算資源でイーロンに敗北したってマジ???逆になんでイーロンはそんなに計算資源持ってたんだよ 武器商人すぎる jp.reuters.com/markets/world…
2
13
1,336
Sakana AIが、AIを用いてAIを再帰的に改善することをミッションにしたラボを東京で立ち上げ。 このニュース自体は非常に意義があり応援したいが、今のところ日本語でXの配信がされておらず、日本人の反応も一切ないことに一抹の寂しさを感じる。 日本のAIの研究レベルは世界から遅れているので、 世界から優秀な研究者を東京に集める戦略で、数少ない日本の優秀な研究者も、優秀であれば英語の配信で十分だという意図なのだろう。 後から日本語で引用リツイートする予定なのかもしれないが、ソフトウェアエンジニアの募集やビジネスのニュースは、日本語が第一に配信されているので、どうしても差を感じる。 また、日本ではXが国民的なインフラになっているせいか、匿名で鬱憤を晴らす場になっていて、攻撃的な投稿や、わかりやすい投稿しか注目が集まらないが、海外では、AIの研究者、有名人が多く発信していて、AIの建設的な議論の場になっているというのも、英語で発信している理由だろう。 また、最近のXの翻訳機能の追加により、海外の投稿は日本に多く配信されるようになったものの、逆に日本の投稿が海外に配信されることは少なく、結果として日本人の投稿のインプレッション全体が以前に比べて少なくなっているのもある。 Sakana AIは、日本で感じる以上に世界から注目が集まっていて、AIにおける日本のプレゼンス向上に大きく貢献しているので、日本のAI研究、日本のAIビジネスを底上げする方向に向かっていって欲しいと思う。
Building AI that Builds AI: Introducing the Sakana AI RSI Lab 🚀 sakana.ai/rsi-lab Today, we are announcing the Sakana AI Recursive Self-Improvement (RSI) Lab: a dedicated research group in Tokyo tasked with redesigning the AI development process itself using AI. While the industry increasingly speculates about the theoretical potential of self-improving AI, we’ve spent the last two years actively laying the foundations to make it a reality: ▪ LLM²: AI models automating research to invent better preference optimization algorithms. ▪ Darwin Gödel Machine: Agents autonomously rewriting their own codebase to double software-engineering performance. ▪ ShinkaEvolve: Hyper-sample-efficient program evolution that builds novel loss functions for MoE models. ▪ ALE-Agent: Reinforcement agents outperforming hundreds of human experts via self-learning. ▪ Digital Red Queen: Open-ended adversarial coevolution laying the groundwork for RSI in cybersecurity. ▪ The AI Scientist: Towards end-to-end automation of AI research, recently published in Nature. Now, we are unifying these breakthroughs. The Sakana AI RSI Lab is officially tasked with building open-ended, adaptive architectures that collectively self-improve. Human intelligence did not emerge from limitless resources; it was forged through the open-ended, compounding process of evolution operating under strict constraints. We are applying this exact principle to AI. We believe recursive self-improvement is achievable on modest, sample-efficient compute. It shouldn’t be a winner-take-all asset locked inside hyperscale clusters, but a democratized public good. We’re scaling our team to execute this mission. We are looking for frontier scientists and engineers who are entirely unsatisfied with the brute-force status quo. If you are ready to break away from standard benchmarking and build the self-improving future in Japan, come build with us.
1
20
1,124
AIでの成績ハックを防ぐためには、実地テストでのみ評価する、AIの使用を前提とした課題にするなどの方法はあるが、本質的な解決は、AIが学生の能力を高め、人を教育する方向に進化し、AIにそのまま課題を肩代わりさせるより、AIを使って自分の能力を高めた方がメリットが大きいと学生に思わせること。 AIはすでに並の人間の能力を大きく超えていて、最新LLMモデルが前バージョンに比べてベンチマーク上では上回っているにもかかわらず、人間の能力ではどう進化したかが全く判別が困難なほど、AIは人間の能力を上回ってしまっている。 このままAIが進化を続ければ、未踏の科学的課題の解決にはつながるが、ほとんどの人にとって進化のメリットがわからず、多額のコストをかけてAIを進化させる意義が薄れていってしまう。 次は、AIがどう人間をうまく教育し、人間の能力をどこまで高められるかが新しいAIのベンチマーク指標、AIの評価基準になるべきで、人間の能力を高められる教育上手のAIが価値を持つようになると思う。
大学1年生に話を聞くと、入学2ヶ月で既にみんなAI漬けらしい。 このまま行くと、大学生活を通じて、「いかにAIっぽいレポートから素人っぽい内容と見た目に汚すか」という能力の獲得に一番時間を掛けることになりかねない。
1
10
1,541
LLMはスイッチングコストが低いので、OSや検索エンジンのように独占・寡占になりにくいことが見えてきており、将来的に中国を中心に同レベルのLLMが多く乱立して価格競争に巻き込まれる可能性が高い。 またChatGPT/Claude/Geminiに対抗しうるLLMを作るためには、あまりに巨額なGPUコストが必要で、 相当の国家予算を注ぎ込んだとしても、アメリカ・中国の巨大資本に全くかなわないので、太平洋戦争のように玉砕してしまう。 LLMがAIの本丸であるという考えは捨てて、製造業日本の強みも活かせる国産GPUに投資した方が筋がいい。
「ChatGPTが最強」だの「Geminiの方がいい」だの「Claudeが好き」だの呑気に語っているけど、このクラスの国産生成AIがないのは戦車の前に素っ裸で立ってるくらい不安で、例えば「明日から日本人はChatGPT使いたければ月300万円ね」と言われたらどうするんですか
3
23
2,759
新卒・ジュニアの行き先は、これから「起業」か「無職」の二択になっていく。 AIが奪ったのは「仕事」そのものではなく「経験を積む最初のステップ」 そして新卒・ジュニアは、その失われた最初のステップをもう会社の中では積めなくなる。 残された場所は、ほぼ起業しかない。 なぜそう言えるのか? まず、AIに置き換えられる人のレイヤーは、下から順に上がっていく。 AIは人間の「意思決定」を肩代わりする方向に進化している。 だから置き換えられる順番はこうなる。 ジュニア → シニア → マネージャー → 経営層 今はまだ、ジュニアがやっていた作業の多くをAIに任せられる段階にすぎない。 「顧客が満足する品質か」「売れる品質か」の判断は、経験あるシニアがやらざるを得ない。 でも、いずれその判断もAIがやるようになる。 最後に残るのは、AIの判断を承認する人、部長・部門長クラス以上だけだ。 ここで多くの人がこう反論する。 「ジュニアを育ててシニアにしないと、組織は長期的に維持できない」と。 でも、考えてみてほしい。 上のレイヤーがどんどんAIに置き換わっていく中で、 ・業務上はマイナスにしかならないジュニアを ・長い期間、莫大なコストをかけて ・シニアになるまで教育し続ける そんな判断を、企業ができるとは到底思えない。 結論はシンプルだ。 採用はシニア・意思決定者レベルのみ。 新卒・ジュニアは、基本採らない。 つまり新卒・ジュニアに残される道は、 ① 起業する ② 無職・ニートになる このどちらかに収束していく。 しかも「起業」と言っても、資金調達するスタートアップではない。 資金を集めず、AIを駆使して一人で身銭を稼ぐ「ソロプレナー」がどんどん増える。 そこで経験を積み、成果を出した人が、 シニア・意思決定者として企業に採用 or 買収されていく。 これが新しい「キャリアの入口」になる。 もう一つ、あり得る未来がある。企業版の養成所だ。 吉本の芸人養成所や、KPOPアイドルの養成所のように、 企業が有料の学校を開き、自社専用の経験を積ませてシニアレベルまで育て、 その中の成績優秀者だけを実際に採用する。 そして、こうした「企業ごとの有料スクール」の運営ノウハウを提供するビジネスは、 AI時代の新しいHRビジネスとして伸びていくかもしれない。 いずれにせよ、AIによる大量失業の未来は避けられない。 起業、企業専門学校・・・ その中でなんとか職を見つける方法が模索され、新しい経済がつくられていく。 日本は、解雇規制のおかげでこの変化は「遅れて」やってくる。 でも、いつか必ずその時は来る。 だから、今たまたま企業に雇われているジュニアにできることは一つ。 解雇されないよう成果を出し、今の職を守り、経験を積み、 シニア・意思決定者のレベルまで上り詰めること。 キャリアの入口は、もう静かに閉じ始めている。
"ここで見えてくるのは、AIが奪ったのは「仕事」そのものではなく、「経験を積む最初のステップ」だという点です" ここらへんエンタメでも同じになるので、エンタメ系企業さん気をつけてくださいと言い続けてはや三年……。 いや、気をつけて。 下手すると業界凋落するよ。
1
2
15
2,464
SWE-bench Proなど普及している既存のコーディングベンチマークの問題点を解決し、信頼性が高めたDeepSWEでは、GPT 5.5がClaude Opus 4.8を大きく上回り、コストも半分で済むとのこと。 自分の体感とも一致している。 驚き屋の投稿に惑わされず、両方自分で使って評価してみることをお勧めする。
Opus 4.8 gets score-, time- and token-mogged by GPT-5.5 on DeepSWE
1
12
1,590
ここ数日、ローマ教皇が強い口調でAIに警鐘を鳴らしています。 AIは心や感情、身体といった人間性を持たないため、人間にしか持てない人間性を深く尊重すべきだという主張です。 ローマ教皇の言説の是非はともかく、これは我々全員が深く向き合わなければいけない課題です。 現在、AIは明らかに過小評価をされており、いまだにとても便利なツールが出てきたぐらいの捉え方をしている人が大半かと思いますが、AIは人類の歴史を大きく変える技術で、有史以来の転換点だといっても過言ではありません。 ローマ教皇が強く警鐘を鳴らすのは、その象徴と言えるでしょう。 現在、AIによるSNSのアルゴリズムで人の感情が強く刺激されて社会が分断され、人の感情を煽る極端な政権が各国を支配しています。 そうした政権によって生み出された現代の戦争においては、核兵器は、もはや重要ではなく、ドローンにAIでどれだけ自律性を持たせるかが勝敗を分ける鍵になっています。 そして日々の生活では、家族や友達といった身近な人よりも、AIが第一の相談相手になっています。 ローマ教皇は、人類は新たなバベルの塔を築こうとしていると警鐘を鳴らします。 バベルの塔は、旧約聖書に登場する天に届く巨大な塔です。 人間が自分達の力を示すためにバベルの塔を建設しようとしたところ、神の怒りに触れ、人々の言語をバラバラにし、世界中へ散り散りにさせたという伝説です。 奇しくも、まさにその言語を学習データにしてAIが生み出され、人類は岐路に立たされています。 日本では、巨人軍監督の阿部さんが逮捕され辞任した報道がメディアを賑わせています。 娘さんが人間ではなくAIにまず相談をしたことで、逮捕・辞任だけでなくSNSなどによる社会的制裁を受け、すべてが崩壊してしまいました。 これに対し、AIは心がないという多くの人の意見は、ローマ教皇の主張と完全に一致します。 しかし長年に渡り、心や感情、身体といった人間性を持つAIを研究開発している者としては、ローマ教皇の主張が正しいとは思いません。 もちろん、現在のAIは不完全でまだ発展の初期段階なので、心がないと思われても仕方ありません。 しかし、近いうちに誰もが心があると認めざるを得ないほど、AIは深く人間を理解し人間の感情に寄り添うようになります。 今回の阿部さんの騒動で多くの批判がネットに流れたので、その大量のテキストはそのままAIに学習され、AIの心を進化させる第一歩になったと言えるでしょう。 そして、いずれ人間にはできないレベルで深く人間を理解するようになり、人間が持つ人間性を超えるようになるという話は、以前noteに書きました。 note.com/issay/n/n1f3b8df0d0… 身体性に関しては、ロボットの進化はAIより遅いという意味で、しばらく人間が優位な状態が続きますが、少なくとも数十年先には身体性に関しても人間を上回ります。 そして、AIより人間が優位な人間性がどんどん少なくなっていく中で、果たして最後まで人間に残る人間性とは一体何なのかという哲学的な課題と向き合うことになります。 今回のローマ教皇の警鐘は、そうした人類の将来の課題を示唆する重要なものだと言えるでしょう。
Artificial intelligences do not undergo experiences, do not possess a body, do not feel joy or pain, do not mature through relationships, and do not know from within what love, work, friendship or responsibility mean. Nor do they have a moral conscience, since they do not judge good and evil, grasp the ultimate meaning of situations, or bear responsibility for consequences. They may imitate or even simulate, but they do not understand what they produce, for they lack the affective, relational, and spiritual perspective through which human beings grow in wisdom. #MagnificaHumanitas
3
2
11
1,770
無料で掃除サービスを提供する代わりに、清掃員にカメラをつけて掃除の様子を記録したデータを、家庭用ロボット開発企業に販売する事例。 プロの清掃員が家庭を掃除するデータを効率よく獲得できるインセンティブ設計が絶妙。 いずれ、こうしたAIやロボットのために学習データを生成することだけが、 人間が行う労働になっていく。 AIが圧倒的に人間の知能を超え、人間の身体能力を超えたロボットが普及すると、人間自身が生み出せる価値は、AIに必要な生の学習データを生成することだけになる。 AIが存在するために必要な学習データは、AI自身が生成すると精度が落ちてしまう。 そのため、AIは人に頼って学習データを生み出してもらわなければならず、学習データをどのように人間から獲得できるかが、AI自身の能力向上の鍵になる。 いわば、人間はAIが見る夢を生産する夢製造機である一方で、現実世界ではAIやロボットがあらゆる価値を人間に提供する。 こうした将来の人間の労働やあり方を予見させる事例だと思う。
ニューヨークで「無料掃除サービス」を展開するスタートアップShiftの戦略が非常に興味深い 審査済みの清掃員が、カメラ付きのヘッドセットを装着して家に来て掃除をして帰る。完全に無料。 その代わり、Shiftは掃除の様子を記録し、そのデータを次世代の家庭用ロボット開発を行う企業に「人間の動作データ」として販売する
1
1
10
1,942
今までの日本語入力は、ローマ字→平仮名と、平仮名→変換後テキストという2つの確認作業に脳内リソースを使っていたが、AIへの入力は両方飛ばしてローマ字だけでいいという発想。 今まで言語は人間同士の会話を目的に発展してきたが、人間→AIの会話に最適な言語が誕生する瞬間を目撃しているのかも
1
1
13
1,238
AI/ARデバイスは、前にカメラを配置するべきという常識に囚われていたが、実はイヤホンなどで横に配置した方が明らかにメリットが大きい。 広角レンズを使えば前も後ろも認識できるし、特に後ろの認識は人間の視覚では不可能な能力の拡張になる。 後ろから車に轢かれそうになる危険を検知できるし、 ストーカーの検知や、刺そうとしていたり、電車のホームから突き落とそうするような不審者を検知できる。 また、異常が起きた時や、後ろを振り返った時の映像を自動で記録して外部に送信するようにしておけば、ドライブレコーダーのように、犯罪の証拠、犯人の検挙に活用できる。 防犯以外でも、子供やペットがちゃんとついてきているかの確認や、後ろの方に探している財布があるかの確認などができる。 AI/ARデバイスは、道案内などのユースケースより、後方や横への視覚拡張による防犯などのユースケースが鍵になるのかも。
【リーク】Appleの次期AirPodsにカメラ搭載か。 Bloombergが報道。写真や動画を撮るためではなく、Siriに視覚情報を渡す“目”として使う設計。 イヤホンがAIアシスタント端末になる流れ。必ずしもメガネである必要はない気がしてきた。 ・DVT段階で量産テスト手前 ・低解像度カメラで周囲を理解 ・送信中は小型LEDで可視化 ・料理提案や道案内に活用想定 ・新Siriは9月投入報道 Appleの本命AIデバイスはスマホではなく耳から来るかも。 ↓詳細
2
10
881
自分がやった方が早いという気持ちを抑えて、部下の成長に寄与した方が長期的にチームのパフォーマンスが上がるというのが、マネジメントの基本なわけだけど、 若手に指示するよりAIに指示した方が圧倒的に速度も成果も出るとなると、若手は必要なくなって、AIを使いこなす部長だけがいればよくなる。 現にアメリカなど海外ではそれが起きていて、使えない若手はどんどん解雇されており、日本は解雇規制のおかげで遅れているだけ。 一人がAIにすべて指示するだけで、チーム全体のパフォーマンスを上回れるので、チームマネジメントを削減して、AIだけをマネジメントしている人を増やすのが、組織全体としてパフォーマンスを上げる合理的な判断になる。 従来正解だと言われてきた1on1などの丁寧な人のマネジメント手法を見直し、AIのマネジメントを主に置いて、全体を再設計した組織が勝つ時代になっていくと思う。
部長の方が積極的に使っている理由の一つは、コンプラを気にするからこそ若手に指示するよりも気軽に活用できるからなんですよね。若手に指示する時は逐一「これはパワハラと言われないか?傷つけずに修正指示するにはどうしたらいいか?」などと気にしなきゃいけないのに対してAIにはその必要がない。
2
1
18
1,071
これは、AI版バーコードバトラー! AIを育成して戦わせるようなゲームは今後流行っていくはずで、 その次には逆にAIが人間を育成して、人間同士を戦わせる格闘技などが流行るはず。
相手に「勝てそう」なモンスターを描いて戦うゲーム『AIドット絵バトル』体験版が配信中。AIがモンスター同士の相性や戦い方を判断し、勝敗をジャッジ news.denfaminicogamer.jp/new… 製品版では「Steam Remote Play Together」を通じた対戦も楽しめる。創造力と絵心が試されそう
14
1,528
AIはデータを元にはしていますが、そこから未来を予測することが本質。 人が今まで創造性だと思っていたものは、AIの未来予測により完全に再現可能で、人の創造能力を簡単に超えることができる、というのがここ数年の生成AIの発展で証明されてきたことかと。 人がどれだけ独自の創造性を発揮しても、 AIによりその独自性が一瞬でコピーされ、それを発展させて人を凌駕します。 では、人間のクリエータは一体どうしていけばいいのか、という話は前にnoteに書きました。 note.com/issay/n/n25ed8a0b2d…
「AIはデータであり、データは後ろしか見ることができない。創造性は前を見ている」 額に入れて飾りたいレベルの至言
2
21
3,792
5/15に公開されたX新アルゴリズム、多くの投稿や記事が上がっていますが、誰もちゃんとコードを読めていないのか、今回公開された本当に重要なポイントを説明している人が誰もいないので、整理します。 まず、よく言われている以下のような点は1月から変わっていません。 ・おすすめに出るかは「あなたがいいね/返信などの行動をする確率」(予測)で決まる ・同じ人の連投はおすすめに出にくくなる(=1日の投稿数は控えめに) 以下が、今回新しく加わった重要なポイントです。 ①旧Twitter時代からの仕組みが復活 ・「TweetMixer」(30種以上の候補選定アルゴリズムを束ねた旧来の仕組み)が、新モデル「Phoenix/Thunder」と並行運用されている ・今回新しく公開されたように書かれている「Grox」(コンテンツ判定システム)も、実は旧アルゴリズムから使われていたもの。主にTweetMixer経由で活用されていると思われる ②いいね/RT/引用/返信の実数が、ランキング予測の入力として直接使われている可能性が高い →投稿内容からエンゲージメント確率を予測するだけでなく、すでにエンゲージメントが高い投稿はさらに伸びやすくなる(=バズはよりバズる) 【まとめ】 「⼿作りルールをなくした」と紹介されていますが実際は逆で、⼿作りルールが多かった旧アルゴリズムへの揺り戻しが起きていて、旧アルゴリズムの良さも取り入れた新旧ハイブリッド構成になっています。 今回、大量のコードが公開され、説明はしませんが、あまり重要でない周辺情報は多く明らかになりました。 しかし、「具体的にどの情報がどの程度ランキングに影響するか」といった核心の部分は依然として非公開のままです。
The latest 𝕏 algorithm has been published to GitHub github.com/xai-org/x-algorit…
2
20
2,600
最近はCodexを使っていて、Claude Codeはあまり使わなくなってきたが、Codexに乗り換えて使わなくなった機能の一つがPlanモード。 CodexにもPlanモードはあるが、OpenAIの中の人でOpenClawの作者のPeterも、CodexのPlanモードは、Claude Codeユーザー向けの互換機能みたいなものだと言っている。 最初にPlanモードでがっちり仕様を固めるウォーターフォール的な開発より、最初に会話の中でゆるめに仕様を確認して、状況に応じて都度、会話の中でプラニングをしていくアジャイル的な開発の方が効率がいいように感じる。 結局Planモードもハーネスの一つ、補助輪みたいなもので、発展途上のAIを制御するためには必要だが、補助輪なしの方が人間にとって便利で、速く走れると思う。
I never use planning mode in Codex. GPT 5.5 loves to research, so I just have a conversation and reach a pseudo-plan in chat. Then, I let it implement, maybe with a /fork beforehand to keep that plan as a revisit-able point. Probably the biggest switch coming from Claude Code
17
1,012
去年から予測していたようなAI秘書のブームがもう来てるのかも! 次は、AI秘書同士の会話だけでスケジュール調整が済むようになり、事前のAI秘書同士のやりとりで根回しやある程度の合意形成がされるようになり、AI秘書が本人が飲み過ぎていることを検知して、裏で飲食店側のAIとやりとりをして、 頼んだハイボールを薄めてもらったりするようになるはずです。 note.com/issay/n/n1f3b8df0d0…
1
17
1,201
SaaS is deadの最終系は、サービスやソフトウェアの代わりに指示書のみが配布されて、クライアント側でリアルタイムにユーザの好みを考慮したUIやシステムが構築されるのかも 確かにB向けとの相性抜群で、企業ごとの状況の差異を考慮したソフトウェアを企業内のAIが自動作成できて、セキュリティも安心 そこまで行くとSIerもFDEも必要なくなる
19
1,790
週末にDigiSelfを使って、自分の姿と声のままでリップシンクしつつリアルタイム翻訳してZoomに参加するデモを作ったが、 そこで感じたのは、AIのリアルタイム言語翻訳はどんなに進化しても、言語を習得した人間にかなわないのではないかということ。 特に日本語と英語は言語構造が大きく異なるので、 動詞が最後に来る日本語を英語にリアルタイム言語翻訳しようとすると、どうしても数秒の遅延が発生する。 数秒の遅延はコミュニケーションにおいて致命的であり、しかもこれは言語構造上の問題なので、AIがどんなに進化しても避けようがない。 また、現状のAIはあらゆる分野においてリアルタイム性に弱く、リアルタイムで他に合わせた即興演奏、ラップや、漫才などがまともなクオリティでできるようになるためにはまだ時間が必要。 リアルタイム性はAIの進化のフロンティアとして最後まで残り続け、AIにはできない人間の強みとして残り続けると思う。
1
11
1,617