Filter
Exclude
Time range
-
Near
【開けゴマ】開発・公開しました。【Web Speech API】 呪文を唱えて扉を開けるブラウザゲーム「開けゴマ」を開発・公開しました。 プレイヤーはマイクに向かって呪文を唱えます。 正しい言葉を発すると、画面の中の扉が左右に開き、黄金の光と共に宝石(💎)が現れます。 「開けゴマ」「オープンセサミ」のいずれの呪文にも対応しています。 音声認識には、無料で利用できるWeb Speech APIを採用しています。 # 所感 アリババと40人の盗賊の有名な呪文「開けゴマ」で扉が開く瞬間を体験でき、とても面白かったです。 Web Speech APIは今回初めて使用しましたが、なかなかの音声認識精度という印象です。 オフライン環境では利用できないようですが、ブラウザゲームに音声認識機能を無料で簡単に実装したい場合に便利なAPIだと思います。 # 動画タイムライン 0:00 本ゲームのプレイ開始 0:01 「開けゴマ」と発声(扉が開く) 0:08 「こんにちは」と発声(反応しないことを確認) 0:13 「オープンセサミ」と発声(扉が開く) # 使用技術 Claude Code(Claude Opus 4.7)/Web Speech API(SpeechRecognition) # 動作環境 Google Chrome/マイク入力デバイス/インターネット接続(Web Speech API の認識エンジン利用のため) # ゲームURL リプライからご確認ください。 # タグ #開けゴマ #ブラウザゲーム #音声認識 #WebSpeechAPI #GameDev
2
24
774
diaがchromeなら標準搭載のAPIがたまに利用できなくて困る 今回のハッカソンもWebSpeechAPIがうまくうごかんくてchromeつかってた
1
7
541
直播或录制视频时想加上实时字幕,方便大家理解,但市面上的工具样式单一且无法修改。 最近在 GitHub 上发现 Curses 这个开源工具,专为 OBS、VRChat、Twitch 和 Discord 提供语音转文字字幕,而且自定义程度非常高。 支持多种语音识别引擎,包括微软 Azure、Speechly、Deepgram 和浏览器自带的 WebSpeechAPI,还能反向将文字转语音输出。 GitHub:github.com/mmpneo/curses 字幕样式可以深度定制,颜色、字体、阴影、背景纹理、打字动画、音效、粒子特效甚至 CSS 都能调,还能直接使用 Google Fonts 的上千种免费字体。 另外支持 Twitch 聊天消息作为字幕来源,可以显示 7TV、FFZ、BTTV 表情包,也能把语音识别结果发送到 Twitch 聊天或 Discord 频道。 提供场景系统,可以保存多套设计方案,并在 OBS 切换场景时自动切换字幕样式,通过 obs-websocket 插件能一键完成 OBS 配置。
9
62
7,163
こんなの 音声認識・翻訳モデルを手元PCで動かすやつは 重くて不安定なの分かりきってる むしろこれで, ChromeのWebSpeechAPI(音声認識字幕ちゃん)の 凄まじい軽さと安定さがバレて もっとみんな使い出す予感がするな🙄
1
18
1,231
Replying to @wesbos
I want WebSpeechAPI in Bun/Node. Huge L for LLM applications. The current solutions suck dog water
1
2
227
Replying to @chibikko_di
WebSpeechAPIはゼフィルスとディープインパクトに実装してるんですが、こんな感じじゃないかも。バージョンかな?見てみます!
1
2
75
WebSpeechAPI精度高いな #58hack
10
144
7 Sep 2025
Day 7 of #30Dayscodingchallenge Hit a new milestone today! For Day 7, I built a Text-to-Speech Reader using the native Web Speech API. This was a really cool project write-to-speak-day-7.vercel.… #Day7 #JavaScript #HTML #CSS #WebDev #WebSpeechAPI #30Dayscodingchallenge #FrontEnd
1
2
53
今日の日付を読み上げるWebアプリを作りました (Claude Codeが) 今はWebSpeechAPIで味気ない声だけど、明日にはVoiceCoreで作ったイケメンボイスに変更予定 なぜ明日かといえば、イケメンボイスの生成が1晩たっても終わらなかったから。。。 d-t-v.com/prog/voicetime/

1
4
220
おおおと思って触ってみたけど、事前に録画された動画をループで流していて、WEBSpeechAPIで音声認識して音声に合わせた動画を流している仕組みだった なので全然Aniと違うけども、このブームに乗ってこのスピード感で出すみたいなところは見習わないといけない。。AI時代はセンサーが大事
今世界中で話題のGrokのAIコンパニオンが早くもオープンソースで公開。 AI業界は公開後数日あれば模倣品がオープンソースで公開される非情な世界。
1
1
11
2,981
AIで作りたいものを作って新たに学ぶことも多いなぁって感じます こないだから作ってる「私のコピーAI」も 対話部分を作るにあたって 「Pythonでいい感じに音声認識してAPIに渡してTTSに渡して~っていうやつ作りたいの。音声認識部分はWebSpeechAPIにしたいから、フロント作ってJsでPythonにそのまま命令渡せるみたいなのいけそ?Django使うほどじゃないからもっと原始的なのでいいですよっ。大まかな流れは~……(以下略)」 ってAIさんと相談したらFlaskで作ってくれて 私は当時Flaskについて知らなくて笑 プロトタイプにこんなお手軽なのあったなんてっ!笑 こないだFlaskについて改めて勉強して、今度はCursol使って大規模リファクタしました…笑
1
1
12
936
Remember when I said this? I finally integrated webspeechAPI into the software. I wanted to use Google's speech API but na money. I go soon host am so y'all can play with it and give feedback
I couldn't successfully integrate the speech thing into my app. What a disappointment that is
1
2
6
365
へぇ 「WebSpeechAPIはW3C(World Wide Web Consortium)によって策定された 主に下記の2つをブラウザ上で音声データを取り扱うAPI」 zenn.dev/east_takumi/article…

1
173
Replying to @osomimao
サーバ側はGAE上にPythonで書いていて、Django系のフレームワークだと思います。 クライアント側の音声認識はWebSpeechAPIを利用しています。あとはjQueryくらいしか使っておらず、登録側もブラウザで動かすWebアプリです。 デザインはGentelellaというBootstrap系のテンプレートを利用しています。
1
6
801
6/11(火) 《Day142》 本日の学習時間:10.5H 総学習時間:700H 【内容】 自己分析面談① バトランアプリ続き 家族に触ってもらって、WebspeechAPIの不具合解消とgoogle認証導入の検討 topページの説明書きの追加 導線の検討 その他コードの微修正 ある程度開発進んだら、周りに意見もらうことが大事
6
201
Discovered a game-changer for developers: the #cypressvoiceplugin. Developed by Dennis Bergevin, this tool uses the #WebSpeechAPI to provide auditory feedback on test outcomes and runtimes. Ideal for enhancing #debugging efforts! 👉 testguild.com/podcast/news/n… @Cypress_io
1
3
2,099
WebSpeechAPIだと漏れちゃうからね… これ結構面白いことできそう
2
130