Joined December 2024
88 Photos and videos
今日スナガクさんっぽいひとを見つけて五度見くらいしました
59
Yume | AIエンジニア retweeted

1
10
44
67,821
Yume | AIエンジニア retweeted
Great to see xAI benchmarking Grok Voice Think Fast 1.0 on 𝜏-voice
Apr 23
Introducing Grok Voice Think Fast 1.0 A state-of-the-art voice model built for complex, multi-step workflows with snappy responses and high accuracy. It takes the top spot on the Tau Voice Bench and handles real-world messiness like noise, accents, and interruptions better than any other model in the world. x.ai/news/grok-voice-think-f…
1
4
77
8,295
Yume | AIエンジニア retweeted

3
99
1,042
616,667
あまり所属は明かさないようにしているのですが、ちらっと共有! 引き続きAI Agentの未来にベットしていきます!
I’m excited to announce that Sierra has acquired Opera Tech in Japan. Opera’s co-founders, Keita Morikawa and Kiyo Kunii, started the company with the simple idea that AI could help businesses deliver high-quality customer experiences at scale. We’re so excited to have them join us to lead Sierra in Japan. sierra.ai/blog/sierra-acquir…
2
1
12
4,102
Yume | AIエンジニア retweeted
I’m excited to announce that Sierra has acquired Opera Tech in Japan. Opera’s co-founders, Keita Morikawa and Kiyo Kunii, started the company with the simple idea that AI could help businesses deliver high-quality customer experiences at scale. We’re so excited to have them join us to lead Sierra in Japan. sierra.ai/blog/sierra-acquir…
16
45
540
213,708
Yume | AIエンジニア retweeted
Last week, Sierra released 𝜏³-Bench, an update to our industry standard agent benchmark, expanding the benchmark in several important ways: 𝜏-Knowledge tests whether agents can operate over large collections of internal company documents spread across systems and formats; 𝜏-Voice evaluates agents built for live voice conversations; and We’ve also incorporated fixes contributed by the 𝜏-Bench community across existing 𝜏-Bench domains to improve evaluation accuracy. Read more here: sierra.ai/blog/bench-advanci…
6
26
203
25,078
Firecrawlを食いに来てるな
CloudflareがWebサイト全体のコンテンツを一度のAPI呼び出しで取得できる新しい /crawl エンドポイントを公開👀✨ これまでサイト全体の情報を取得するには、リンクを辿るクローラーを自作し、ブラウザの自動操作やHTML取得、JavaScriptレンダリングなどを組み合わせて処理する必要があった。こうした作業は検索エンジンや大規模サービスでは当たり前の技術だが、個人開発やAI用途で扱うには意外と手間のかかる工程でもあった。 今回公開された /crawl エンドポイントでは、その複雑な処理をCloudflareのインフラ側が引き受ける。開発者はURLを一つ渡すだけで、そのサイトに含まれるページを自動的に巡回し、各ページのURL、タイトル、そして完全なHTMLコンテンツを取得できる。結果はHTMLだけでなくMarkdownやJSONでも返されるため、AIやプログラムから扱いやすい形でそのまま利用することができる。 現在のAIシステムでは、外部の情報を取り込みながら回答を生成するRAGや検索型AIが広く使われているが、その前提になるのが「知識をどこから取得するか」という問題になる。/crawl はその入口を極端にシンプルにする。URLを渡すだけでサイト全体のコンテンツが取得できるため、ドキュメントサイトやブログ、ニュースなどをまとめて取り込み、AIの知識ベースや検索システムのデータとして活用できるようになる。 言い換えるなら、これは「サイトを読むロボット」をAPIとして提供し始めたようなものになる。これまで自前で構築する必要があったクローリング基盤がAPI一つに抽象化されたことで、開発者はデータ収集の仕組みではなく、そのデータをどう活用するかという設計に集中できるようになる。インターネットを人間が読むページの集合として扱う時代から、AIが知識として読み取るためのデータ源として扱う時代へ移りつつある中で、このようなインフラはその基盤の一つになりそうじゃな🧐✨
5
1,292
NLP初参加でしたが、知り合いの知り合いがたくさん居て楽しかった!
2
228
データ基盤の文脈でも、課金モデルについては結構悩ましい議論 1. SaaSとしてシート課金(ユーザー数課金)にする 2. データ処理した時のバイト数に応じて課金する 3. インスタンスの稼働時間で課金する そこら辺をどう設計するのがいいのかは、非常に難しい
シート課金がいいのか、仕事課金がいいのかというのは意外と単純ではない。例えば経費精算の場合、「申請数」ベースの仕事課金にしてはどうか?という社内議論は毎回出てくる。 では仕事課金にするといいのか?というと「月末にたまった領収書を一気に申請して、1つの申請数にまとめよう」とするインセンが働いてしまう。そうすると、本来即時に出してほしい領収書が月末一気に集中して、月次決算が遅くなってしまう。 またそもそも月次の「申請数」を正確に把握しているケースも少なく、仕事課金に寄せすぎると、顧客からした時予算が読みづらいという問題も出てくる。 なので顧客心理的にはシート課金(定額)にして、「申請数の制限はありません」とした方が良いケースもある。即時に領収書をだしてくれるので全体として決算も早まるし、確認業務も分散化できる。 シート課金か仕事課金かよりも、顧客にとってのぞましい価格体系になっており、その価格はvalue-basedで設定されているか?が本質だと思う。(そもそもOpenAIやAnthropicのサブスクもシート課金だし...API連動の部分はあれど)
2
471
Typeless、セキュリティ系でプチバズってから粛々と情報管理も固めてて偉い👏 Zennのこの記事もまあわかるとなった zenn.dev/kazuma_horiike/arti…
Typeless is now GDPR compliant 🇪🇺🛡️ We're building the Typeless future - private by design: 1. Zero cloud data retention 2. Never trained on your data 3. On-device history storage Track our security progress: trust.typeless.com - Written with @typelessdotcom
1
414
📝コンタクトセンターのAI化は、AIエージェントの次のフロンティアなのでエンジニアも知っておくと良さそうです。 顧客接点の最前線であること、AgentSDKエコスシステムの成長により去年ごろから本格的にワークフロー全体をAIで完結させる道筋が見えてきたこと。VoiceOSやTypeless, ElevenlabsなどでわかるようにSTT/TTSの高度化もある。 SMBCさんの事例が顕著で、すでに一部AIオペレーターを導入し、24時間自由発話対応を実現している。 今年はB2C領域でのAIエージェント実装が一気に具体化してきそうです!
日本コンタクトセンター協会主催の「コンタクトセンター・セミナー2026」において、基調講演をさせていただきました。 2026-27年にかけて、現在進行形で各大企業様が裏で仕込んでいるAIが本番デプロイされ、日本でも電話・チャット・メールの応対は基本AIから始まることが珍しくなくなると思われます。 prtimes.jp/main/html/rd/p/00…
1
517
Yume | AIエンジニア retweeted
【Codex CLI 0.105.0 リリース】 音声入力の対応とマルチエージェントの強化があり、大注目のアップデートです。要点を解説します。 【音声入力】 ターミナル上で音声によって Codex にプロンプト指示ができるようになりました。 config.toml の [features] 配下に voice_transcription = true を追加すると有効化できます。 Codex 起動後、プロンプトが空欄の状態でスペースバーを長押しして話し、離すと文字起こしされます。 初回はターミナルからマイクの使用許可を求められるので、許可すれば使えるようになります。 デフォルトで音声入力ができて便利です。実際に試したところ、日本語入力も問題なさそうです。 【マルチエージェント強化】 サブエージェントからさらにサブを起動するネスト構成に対応しました。 マルチエージェント自体が実験的機能なので、未有効の場合は [features].multi_agent = true が必要です。加えて config.toml に agents.max_depth = 2 を追加しないとネスト起動ができません。 デフォルトは agents.max_depth = 1 扱いなので、明示的に設定が必要な点に注意してください。 また、サブエージェントにはニックネームが自動で付与されるようになり、今までの UUID のような形式と違ってだいぶ見分けやすくなりました。子スレッドの承認プロンプトも可視化され、エージェントピッカー UI も整理されています。 【その他の主な変更】 ✅ TUI でコードブロック・diff のシンタックスハイライト対応(/theme ピッカーも追加) ✅ /copy で最新のアシスタント返答をコピー ✅ /clear と Ctrl-L でスクリーンクリア(/clear は新チャット開始も可) ✅ 承認制御の柔軟化(コマンド単位で追加権限要求、特定プロンプトタイプの自動拒否) ✅ Linux sandbox に /dev マウント追加 ✅ @ パース修正(npx -y @scope/pkg@latest でファイルピッカーが誤作動しなくなった) 後ほど詳細についてもさらに解説していく予定です。
1
17
54
11,269
Yume | AIエンジニア retweeted
日本向けに多数のプロンプトインジェクションを狙った不正メールが到達しています。AIをメールと連携されている環境はご注意ください。 HTMLメールの中に白いフォントで隠れた英語メッセージも埋め込まれてますが、これは意味のない内容のように見えます。本来は英語の文を本文として表示し、日本語のプロンプトインジェクションを隠れたメッセージにしたかったのかも。
1
412
824
242,247
Yume | AIエンジニア retweeted
the Responses API now supports WebSockets! this can make your agents run 30-40% faster, especially when they make a lot of tool calls
Introducing WebSockets in the Responses API. Built for low-latency, long-running agents with heavy tool calls. developers.openai.com/api/do…
64
129
2,997
459,811
Gemini からも音楽生成きた。
Introducing Lyria 3, our new music generation model in Gemini that lets you turn any idea, photo, or video into a high-fidelity track with custom lyrics. From funny jingles to lo-fi beats, you can create custom 30-second soundtracks for any moment. See how it works. 🧵
1
274
たのしみ〜
3月19日に Codex Meetup Tokyo 開催していきます!!💪 予定抑えてね!(会場は押さえてあるので、少ししたらイベントページ公開します!
1
351
Graphite って Cursor が買収したやつ、課金するバリューがあるか知りたい。使ってる人いるかな
1
2
240
Yume | AIエンジニア retweeted
FocuSeeという画面録画サービス試してる。 背景削除と簡単な字幕入れられるのがいいのと、 Zoomの仕方がScreen Studioより見やすい気がする。
2
8
225
31,453