Filter
Exclude
Time range
-
Near
2026.5.30開催の「#JJUG CCC 2026 Spring」で、Gen-AX エンジニアの松田一樹が登壇した資料を公開しました🙌 ぜひご覧ください。 speakerdeck.com/genax/gen-ax… #GenAX #AIエージェント #音声AI #RealtimeAPI #Kotlin
【登壇のお知らせ】2026.5.30開催の「#JJUG CCC 2026 Spring」に、Gen-AX エンジニアの松田一樹が登壇します。 テーマは、 AI 時代の “Software Engineering” — Server Side Realtime Event Handling を、Coding Agent と Software Engineering で Re-Design した経験から。 11時~から登壇します📢
2
2
561
【図解でわかる生成AIニュース】 OpenAIが、音声AIの反応速度と知能を劇的に進化させる「Realtime API」向けの新モデル3種を発表しました!!😲 ✅「考える」音声AI:推論特化型モデル(o1ベース)の導入で、複雑な質問にも声で即答 ✅翻訳・文字起こしが爆速:会話をリアルタイムで理解し、遅延なしでテキスト化や翻訳が可能 ✅感情豊かな表現力:より人間に近い自然なトーンや抑揚で、スムーズな対話を実現 💡 「AIと電話で話す」体験が、単なる受け答えから「一緒に問題を解く」レベルへ。カスタマーサポートや語学学習のあり方が根本から変わりそうです💻 #OpenAI #RealtimeAPI
1
4
88
OpenAI DevDay 再誕 去年はRealTimeAPIやGPT内アプリ、Sora API、Codex、AgentKitとか色々ありましたが、かなり様変わりしましたね。 今年は何が降ってくるかな?
Apr 29
OpenAI DevDay is back. San Francisco September 29
1
15
1,888
The future of "Hands-Free" UI is officially here. OpenAI developer Jason Liu just showcased the power of the gpt-realtime model, and it’s a game-changer for how we interact with web apps. No screen scraping—just pure, low-latency natural speech. Dynamic Control: Toggled dark mode and navigated UI via voice. Contextual Forms: Filled out complex forms by simply dictating details. Real-time Gaming: Played a full game of chess by voicing moves like "Knight to F3." While the community noted minor "jargon" hiccups and audio loops, the speed is undeniable. We’re moving away from clicking and dragging toward a world where apps simply listen and react. From kids' phonics apps to accessibility tools, the "Voice-First" era is gaining serious momentum. 🚀 #OpenAI #RealtimeAPI #GPT4o
You can build interactive applications with gpt-realtime-1.5, so users can control app state more naturally with voice. Hi Chappy 👋
1
3
79
現場で使われる音声AIの今を理解するのに素晴らしすぎるブログでした! 「RealtimeAPI Twilioで作れるじゃん」「コールセンター完全終了!」ボイスボットにもPBXにもその統合にも運用に向けたチャレンジは山積みです🔥
最近イベントなどや打ち合わせの場で「ElevenLabsってSTSないの?」と言われる機会も多くなりました。 本noteブログはの質問に対するElevenLabsとしての回答となります。 気になる方はご笑覧ください。 note.com/taka_410/n/nfc1e081…
1
1
13
3,864
Replying to @mongonta555
TakaoBase=trueで横から給電のときはM5.update()の戻りが遅くなる傾向が見られたので、RealtimeAPIの処理をloop()とは別のタスクにして優先度を上げることで、音声が途切れる問題は解決しました。もうちょっと調整したらissueのブランチにマージします。
1
2
3
265
Replying to @FruitRiin @shun3ai
Whisper使ってるときはVADって技術使ってました!(無音処理と同じ感じ?) ずっと流し続けるのOPENAIのRealtimeAPIでも出来ます。こちらはストリーミングで音声送り続けると勝手に音声検出とwhisper文字起こし( 使わなくてもいいけど返答)をしてくれるものです。トークンもそこまで多くなく。
1
2
81
𝗩𝗼𝗶𝗰𝗲 𝗔𝗜 𝗷𝘂𝘀𝘁 𝗴𝗼𝘁 𝗮 𝗺𝗮𝘀𝘀𝗶𝘃𝗲 𝘂𝗽𝗴𝗿𝗮𝗱𝗲. OpenAI just dropped gpt-realtime-1.5 in the Realtime API, and the stats are a game-changer for developers. We are looking at a new standard for voice-first apps. 🧵 #OpenAI #VoiceAI #RealtimeAPI
2
1
9
475
【AI開発✨】 最近の積上げ ✅Claude Codeを複数連携させたチーム開発 ✅Antigravity with Opus 4.6(無料枠ありがたい)で開発 ✅MulmoChat(RealTimeAPI)で会話でSkillsを更新 ✅Claude Coworkで事業分析・PPT資料作成など 2025年、AIエージェント元年と言われていましたが、 2026年こそ、みんなが使い始める本当の元年だと確信しています! #AI開発
2
432
Replying to @rymm_nap
独り言モードは削ってしまったので、良い機能ですね😀ご存じかもしれませんが、RealtimeAPIとVOICEVOX(ずんだもん等)を組み合わせる設定方法も公開しています(下記README)。CoreS3じゃないとメモリ不足で動きませんが... x.com/motoh_tw/status/197377…

1
2
6
258
29 Dec 2025
メモリー機能の主な特徴 ・ChatGPT(RealtimeAPI含む)に対応。会話中にユーザーの属性(趣味や仕事など)をSPIFFSに記憶する ・SDカードのYAMLで有効/無効化 ・メモリーの内容はブラウザアプリで確認/消去可能
1
2
7
361
19 Dec 2025
Stop Juggling STT Vendors. Start Scaling Global Voice Apps. For years, building real-time, multilingual AI meant choosing between the fastest ASR engine, the most accurate one, or the one with the best language coverage then integrating them all separately. It's time to retire the complex orchestration layer. Introducing the Telnyx Real-Time STT API. It unifies our in-house engine (powered by Whisper), Google STT, Azure STT and Deepgram STT into a single, powerful API. You switch engines based on cost, accuracy, or language via a single parameter. The result: Sub-250ms latency, 100 language support, and true enterprise flexibility, all without changing your core code. The easiest way to scale voice and AI. Learn more: vist.ly/4j5tb #STT #RealTimeAPI #ConversationalAI #DeveloperTools #VoiceAI #Telnyx
3
128
realtimeapiのアプデ来てるんか
6
69
Google のTTS今度テストする 固定にも置いてあるけど 動画は丁度1年前 OpenAIのRealtimeAPIを活用して演技をさせてRVCで声を変えた時のもの。 去年の段階でこれくらい演技はOpenAIの技術でできた 期待
6
393
音声AIに関してはOpenAIのRealtimeAPIが公開されている現在、ある程度の知識あれば自然に話せるものは全然作れる。なので会話の自然さでの競争は半年くらいすれば意味がなくなるのは明らかです。 一方難しいのは、その音声AIに何をしゃべらせるか?しゃべらせないか?の細かい制御で、条件分岐で呼ぶツールを変えたり、緊急性に応じて人に転送するルートを用意したりして、それぞれの場面に応じてAIと話しているお客様のストレスを感じさせない設計が何よりも大事です。
1
4
477
おはようございます⛅️ 朝活継続中のここあんです🫡 今年も残り42日…一時一時を大切に! =2025年朝活記録✍️= 11/18時点 276勝48敗🆙(達成率85.2%) ■今日の積み上げ ・input📔 → RealtimeAPI関連 ・output🧑‍💻→ WebAPP構築/見積もり算出 #朝活チャレンジ #今日の積み上げ #71120おは戦🌳KA
2
20
112
なつかしい。去年のQiitaアドカレでRealtimeAPIの記事を書いたのがナル先生のことを知るきっかけでした。
7 Nov 2025
記事を投稿しました! ミニ四駆を買って改造してたらサンフランシスコのOpenAI DevDayに参加できた話① [ポエム] on #Qiita qiita.com/Null-Sensei/items/…
1
2
2,419
15 Oct 2025
Core2でメモリ不足に苛まれていたため公開に時間がかかりました。改善はしましたが若干不安定なので、RealtimeAPI TTSはCoreS3推奨です。
1
7
316