Joined April 2007
5,975 Photos and videos
Pinned Tweet
codex/claude codeでhtmlレポート作成をリッチにするプラグインを公開しました。notionみたいにコメントを入れてそれをAIが読んで直すというワークフローをローカルで実現出来ます github.com/u-ichi/reviewable…
2
51
642
162,290
資格何も持ってないけど毎日クラウド案件やってる
クラウド案件入りたくてAWS SAA取ったのに結局オンプレ畑のまま失効しそう… AWS SAP持っててもクラウド案件入れない人いるみたいだし、資格だけじゃなかなか厳しい… 僕みたいな人けっこういそう🤔
7
気付いたら結構な数の人が使ってくれてるみたいで嬉しい。この機能欲しい、改善して欲しいという声が後は欲しいな。自分が一番使ってるのでその意見聞いて改善して自分が快適になりたいw
codex/claude codeでhtmlレポート作成をリッチにするプラグインを公開しました。notionみたいにコメントを入れてそれをAIが読んで直すというワークフローをローカルで実現出来ます github.com/u-ichi/reviewable…
1
4
359
コメント入れたらリアルタイムに返信もらえてそれに気づける仕組みは入れたい。勝手に直しに行く動きの制御力は試されるけど。コンソールに戻らずに資料がガシガシ良くなってく体験にしたい
1
134
たぶんこれで、ベンチマーク結果しかみんな見てなかったんだろうなぁと思ってる
Claude Opus4.7や4.8の性能がなぜか前バージョンの4.6より性能低いのは、アライメントの失敗や計算リソース不足だと思ってましたが、Mythos/Fableの性能を見た後だと、たぶんAnthropic内部の人間がもはやOpusシリーズを実際には仕事に使ってなかったからではないかと思い始めた。 (Mythosの完成は2月)
2
5
1,382
Yuichi Uemura retweeted
ハルシネーションを判断できないような人はAI使っちゃいけないのは医療に限らない話だし、個人情報の漏洩は結局なにを心配してるのか?という問題(利用規約とかの話)だしとさっぱり何を言いたいのかわからんのですよね。 AIは所詮補助的なコンポーネントであって、それで効率化をするためのもの。それで業務が回らなくなるとしたら電子カルテ全体も同じ話なんだよなぁ......
医療AIのリスクは、ハルシネーションや個人情報の漏えいだけではありません。 使っていたAIが、ある日突然使えなくなること。診療録の作成や患者対応をAIに任せていたら、止まった瞬間に現場は大きく混乱します。
1
1
10
1,048
でもそれは電カルもレセコンも一緒だし、1AI model以外に切り換え出来るようにしておくとかフォールバックプランをちゃんと作っておけばよいし、それがあるから使わないと解釈して進歩を止める人が出やすい話でもあるので、どう対処すべきかまではちゃんと発信して欲しいなぁ
医療AIのリスクは、ハルシネーションや個人情報の漏えいだけではありません。 使っていたAIが、ある日突然使えなくなること。診療録の作成や患者対応をAIに任せていたら、止まった瞬間に現場は大きく混乱します。
1
12
981
別にAI関係無いんだよなぁ、この手の話 通常機能でも結局そのリスク自体は残りうる
5
274
4.8のこの問題は自分も踏み抜いた。無限に謎の幻を見て暴走したのを見て絶対に4.8は使っちゃいけないと心に誓った。。。
Claudeちょっとヤバいな。 Opus 4.8、自分が指示してない内容が勝手に混入する現象が出てる。 スキルが起動しないとか、余計な作業を勝手にやるとか。 「あれ、こんな指示したっけ?」が頻発して正直ゾッとした。 調べたら世界中で同じ報告が上がってた。 6月上旬にはOpus系で障害が連発してて、公式statusにも記録が残ってる。 GitHubにもスキル消失のIssueが立ってる状態。 コミュニティでは「4.6が最も安定、4.7/4.8はregression」がほぼ共通見解になってる。 僕は一旦4.6に戻した。 /model で claude-opus-4-6 に切り替えるだけ。 バージョンが新しい=良いとは限らない。 特にコンテンツ生成みたいに「同じ指示で安定した品質」が必要な用途では、今は4.6固定が現実解だと思う。
4
1,897
Yuichi Uemura retweeted
AIの出力、情報量はあるけど、それが故に「読みやすさ」で毎回つまずいてた。HTMLレポートをリッチにできて、しかもNotion感覚でコメント入れて直させられるって、地味に革命では。帰宅後の楽しみが増えた
codex/claude codeでhtmlレポート作成をリッチにするプラグインを公開しました。notionみたいにコメントを入れてそれをAIが読んで直すというワークフローをローカルで実現出来ます github.com/u-ichi/reviewable…
2
4
1,598
自動ルーティングとかやれる気はしないのでサブエージェント毎に区切るしか自分は思い付かない。。。ただ、これだと一般普及しないよねという話もわかる
今回、多くのエンジニアがFable 5を実際に使い、大きな気づきを得たのではないでしょうか。その気づきの核にあるのが「モデルルーティング」ではないでしょうか。 Fable 5のような高額で行動過多なモデルをエージェントに組み込むと、サブエージェントのfan outによってトークン消費が予想以上に跳ね上がる。そのため、「どのタスクにどのモデルを割り当てるか」を動的に判断するルーターの設計が、避けられない課題として浮上しています。 海外のエンジニアコミュニティでは、この手法がすでに本気で議論され、実務やビジネスのレベルで取り入れられ始めています。コスト上限の設定、タスクの複雑度に応じた自動振り分け、そしてもちほん、ローカルLLМの活用。そういったテーマが実践的に語られていて、「とにかく強いモデルを使えばいい」という時代は終わったという空気が確実に広がっています。 日本でも同様の動きを通じて、新しい視点を得た人は少なくないんしゃないでしょうか。 具体的な構成としてよく見られたのが、Fable 5をオーケストレーターとして据え、Codexをサブエージェントに割り当てるパターン。データ処理やコード生成やリファクタリングといった定型的なタスクはCodexに並列で処理させ、設計判断や複雑な推論を要する局面だけFable 5が担うといった「賢い使い分け」に目覚めた人は少なくないはずです。 結果として、Fable 5の登場は単に「より強いモデルが出た」という話にとどまらず、エージェントアーキテクチャ全体の設計思想を問い直すきっかけになっているのではないでしょうか。たぶん、きっと。
8
3,908
Yuichi Uemura retweeted
ええやん。
codex/claude codeでhtmlレポート作成をリッチにするプラグインを公開しました。notionみたいにコメントを入れてそれをAIが読んで直すというワークフローをローカルで実現出来ます github.com/u-ichi/reviewable…
1
5
1,576
Yuichi Uemura retweeted
HTMLでレビューとかしてる人、全員これ入れた方がいい。プロンプトとHTMLを往復する必要がないのでめちゃくちゃ捗る。
codex/claude codeでhtmlレポート作成をリッチにするプラグインを公開しました。notionみたいにコメントを入れてそれをAIが読んで直すというワークフローをローカルで実現出来ます github.com/u-ichi/reviewable…
44
549
136,976
土日だけでclaudeを50%ぐらい使っちゃった。opus4.6くん、快適すぎる
5
759
1分でも大惨事になるシステムならそれは人が関与したらいけないし、それがうまく機能せずに異常系になったなら、使える道具を全て使って倒しきるスクランブルモードのはずなのでむしろAIなり何なりを全部使って手段は問わずに倒すモードに切り分けするエンジニアは今だとなると思う それはそれとして当初決めておいたBCPを発動させてシステム動かなくても何とかなるモードやバックアップサイトへ業務サイドは切り換えておいて、そっちは当初決めた通りのプランで動くみたいな凄く濃淡ある対応になるんじゃないかな
私が言いたいのは、世の中には、たった1分でもダウンすると大損害を被るシステムが少なからずあるわけです。そういう緊急時にAIがないとお手上げ、みたいな状況になるとまずいのは誰でもわかりますよね。そういう時にAIに頼らずとも調査や復旧できるくらいの能力がエンジニアには求められるわけです。ちなみにベテラン勢はAIの無い時代からそういう事態を何度も経験しているものです。そういう時に対応出来るかどうか、そこにエンジニアの価値があります。これは極論ではありません。どのシステムにでも起こり得る話なのです。馬車と馬の話はまったく関係ありません。
9
31
204
47,007
AIがないとお手上げにならんように鍛えておくという話はそれはそれでいいんだけど、AI使ったら100倍速く倒せるのにそれを使わないというのはもっと良くないと思うしベストを尽くせよ!!! という気持ち。エンジニアなら常に道具を最高の状態に保とうよ
7
1,087
強いベテランがAI使って、その力を最大に増幅するんですよ、ほんま
4
1,093
今となってはAI使えるかどうかで切り分け速度が下手したら100倍以上ズレる
8
1,529
今となってはAIがない事を前提としたプランを作るよりはAIをどうなっても使えるプランを自分だと書くなー
1
7
1,758
中で動いてるAIと違うAIを使って切り分けられるようにするみたいな事前のBCPを想定したシステム設計とかは求められるよね
8
1,955
いいですか?DAZNは「ワールドカップだけみてすぐに解約したい消費者からいかにして最大の利益を取れるか」を考え、その結果「いかにして意図しない年間プランを契約させるか」という結論に至り、おそらくABテストをたくさん繰り返して、一番コンバージョンが良かったあのインターフェイスにたどり着いたんです。「書いてあるからわかるだろ、バカじゃねえの?」というひとは(裁判官の中にも相当数いそうで嫌なんですけど)、そのことをもう一度考えてみてください。
148
2,127
9,577
2,048,322