スタートアップ@AlgomaticJpの26歳のAIエンジニア / AIの研究と事業をつなぐ人。/neodesign-ai.com / 情報系修士卒/ 登壇・イベント登壇のご依頼はDMからお気軽にどうぞ。

Joined February 2025
142 Photos and videos
Pinned Tweet

10
128
1,248
524,086
Googleのロボティクス用途のVLMモデルを用いた、商品棚の画像からの補充の必要な箇所の検出(実験)。 このモデルはReasoningができるので、普通の物体検出のモデルと比較して比較的長いプロンプトを受け付けて、複雑な条件での物体検出が可能。
Googleの物体検出に強いモデル(Gemini Robotics-ER 1.6)を用いて、画像の中の危険予知を行うデモ 作業場とか、介護の場面を想定。 *画像はAI生成されたものを利用
179
オフラインデータを活用してオンライン強化学習を効率化する手法、RLPD(Reinforcement Learning with Prior Data)も試した。
ロボットアームをシミュレーション内で強化学習させるい実験をしてみた Claude Codeの/goalコマンドで「成功するまで学習させて」とOpus4.8に頼んで実験を自動化させた 実験条件 - SO-101 - Genesis, rsl_rl - PPO - Mac M2 リアルのSO-101でやっていきたい SAC(Soft Actor-Critic)に挑戦したい
1
4
785
RLPDは、「オフラインで事前学習 → オンラインでファインチューニング」という2段階方式の難しさ(分布シフト、忘却)を回避し、最初からオフライン・オンライン両方のデータを混ぜて単一フェーズで学習するのが特徴。 arxiv.org/pdf/2302.02948

113
Googleの物体検出に強いモデル(Gemini Robotics-ER 1.6)を用いて、画像の中の危険予知を行うデモ 作業場とか、介護の場面を想定。 *画像はAI生成されたものを利用
Gemini-ER 1.6を図面に対して適用する実験 1枚目、穴の箇所の検出 2枚目、仕上げ加工が必要な面の検出 3枚目、加工の順番に番号を振る。ラベルは短く加工方法を提示。 *図面は画像生成されたデータ。
4
552
Goalコマンドは、ロボットの成功・失敗のような明確な合格基準があるタスクとは相性がいいと思います。 Claude Codeが5時間くらいかけて精度を上げるというゴールを達成しようとしてくれました。 特に重要なのはその達成するための手段を事前にある程度与えてあげることだと思っています。
ロボットアームをシミュレーション内で強化学習させるい実験をしてみた Claude Codeの/goalコマンドで「成功するまで学習させて」とOpus4.8に頼んで実験を自動化させた 実験条件 - SO-101 - Genesis, rsl_rl - PPO - Mac M2 リアルのSO-101でやっていきたい SAC(Soft Actor-Critic)に挑戦したい
1
348
Gemini ER 1.6による、障害物を回避する軌道の生成
266
Gemini-ER 1.6を図面に対して適用する実験 1枚目、穴の箇所の検出 2枚目、仕上げ加工が必要な面の検出 3枚目、加工の順番に番号を振る。ラベルは短く加工方法を提示。 *図面は画像生成されたデータ。
2
511
Gemini ER 1.6で経路を出力 障害物を避けるような出力をさせた
Gemini Robotics-ER 1.6モデルを使って物体検出をしてロボットアームを動かす 「信号機の止まれに使われる色のブロックを持ち上げる」と指示→赤色のオブジェクトを持ち上げた
245
Gemini Robotics-ER 1.6モデルを使って物体検出をしてロボットアームを動かす 「信号機の止まれに使われる色のブロックを持ち上げる」と指示→赤色のオブジェクトを持ち上げた
ロボットアームをシミュレーション内で強化学習させるい実験をしてみた Claude Codeの/goalコマンドで「成功するまで学習させて」とOpus4.8に頼んで実験を自動化させた 実験条件 - SO-101 - Genesis, rsl_rl - PPO - Mac M2 リアルのSO-101でやっていきたい SAC(Soft Actor-Critic)に挑戦したい
2
689
SAC vs PPO vs ACT SAC won やはりPPOは収束せず
171
ロボットアームをシミュレーション内で強化学習させるい実験をしてみた Claude Codeの/goalコマンドで「成功するまで学習させて」とOpus4.8に頼んで実験を自動化させた 実験条件 - SO-101 - Genesis, rsl_rl - PPO - Mac M2 リアルのSO-101でやっていきたい SAC(Soft Actor-Critic)に挑戦したい
1
4
2,211
Yusuke retweeted
今月からAlgomaticに入社しました!!! 引き続きAI領域でAXに取り組みます!🔥 登壇等もやりたい気持ちなので、引き続きご連絡お待ちしてます!!!
11
15
175
20,785
登壇させていただきました! 運営の皆様、参加してくださった皆様ありがとうございました!
本日Claude Code Meetup Japan 5に 登壇させていただきます! 登壇で使用する資料はこちらです。 speakerdeck.com/shuredev/jia…
1
1
12
1,137
登壇させていただきました! 運営の皆様、参加してくださった皆様ありがとうございました。 登壇で使用したスライドは公開してます!
本日Claude Code Meetup Japan 5に 登壇させていただきます! 登壇で使用する資料はこちらです。 speakerdeck.com/shuredev/jia…
1
3
367
Yusuke retweeted
> 教師あり学習を用いたSkillsの最適化 #ClaudeCodeMeetup
本日Claude Code Meetup Japan 5に 登壇させていただきます! 登壇で使用する資料はこちらです。 speakerdeck.com/shuredev/jia…
1
9
86
12,599
本日Claude Code Meetup Japan 5に 登壇させていただきます! 登壇で使用する資料はこちらです。 speakerdeck.com/shuredev/jia…
5/14に開催されるClaude Code Meetup Japan 5の10分枠に登壇させていただくことになりました。 以前記事にした”Skillsの最適化”などについて話したいと考えています。 当日はよろしくお願いいたします。
2
10
38
18,422