miya

miya

Users
Tweets

miya

@miya00907380

May 23

【開けゴマ】開発・公開しました。【Web Speech API】呪文を唱えて扉を開けるブラウザゲーム「開けゴマ」を開発・公開しました。プレイヤーはマイクに向かって呪文を唱えます。正しい言葉を発すると、画面の中の扉が左右に開き、黄金の光と共に宝石（💎）が現れます。「開けゴマ」「オープンセサミ」のいずれの呪文にも対応しています。音声認識には、無料で利用できるWeb Speech APIを採用しています。 # 所感アリババと40人の盗賊の有名な呪文「開けゴマ」で扉が開く瞬間を体験でき、とても面白かったです。 Web Speech APIは今回初めて使用しましたが、なかなかの音声認識精度という印象です。オフライン環境では利用できないようですが、ブラウザゲームに音声認識機能を無料で簡単に実装したい場合に便利なAPIだと思います。 # 動画タイムライン 0:00 本ゲームのプレイ開始 0:01 「開けゴマ」と発声（扉が開く） 0:08 「こんにちは」と発声（反応しないことを確認） 0:13 「オープンセサミ」と発声（扉が開く） # 使用技術 Claude Code（Claude Opus 4.7）/Web Speech API（SpeechRecognition） # 動作環境 Google Chrome/マイク入力デバイス/インターネット接続（Web Speech API の認識エンジン利用のため） # ゲームURL リプライからご確認ください。 # タグ #開けゴマ #ブラウザゲーム #音声認識 #WebSpeechAPI #GameDev

0:20

774

つかびー | ミツカリ執行役員CTO

つかびー | ミツカリ執行役員CTO @tsukaby0

Feb 23

会議の音声を処理するWebアプリを作るための技術調査 - ミツカリ技術ブログ tech-blog.mitsucari.com/entr… #はてなブログ #WebSpeechAPI #Recall.ai #音声技術 #STT

会議の音声を処理するWebアプリを作るための技術調査 - ミツカリ技術ブログ

こんにちは、ミツカリCTOの塚本こと、つかびー(@tsukaby0) です。近年、音声を処理するWebアプリが急速に増えています。たとえば会議の文字起こし・要約を行う Otter.ai や Fireflies.ai、日本語特化の Notta や Rimo Voice、商談解析の amptalk や MiiTelなど、…

tech-blog.mitsucari.com

1,109

ゆうだい

ゆうだい @yuuudaiiiiii

Feb 23

diaがchromeなら標準搭載のAPIがたまに利用できなくて困る今回のハッカソンもWebSpeechAPIがうまくうごかんくてchromeつかってた

541

GitHubDaily

GitHubDaily

@GitHub_Daily

Jan 28

直播或录制视频时想加上实时字幕，方便大家理解，但市面上的工具样式单一且无法修改。最近在 GitHub 上发现 Curses 这个开源工具，专为 OBS、VRChat、Twitch 和 Discord 提供语音转文字字幕，而且自定义程度非常高。支持多种语音识别引擎，包括微软 Azure、Speechly、Deepgram 和浏览器自带的 WebSpeechAPI，还能反向将文字转语音输出。 GitHub：github.com/mmpneo/curses 字幕样式可以深度定制，颜色、字体、阴影、背景纹理、打字动画、音效、粒子特效甚至 CSS 都能调，还能直接使用 Google Fonts 的上千种免费字体。另外支持 Twitch 聊天消息作为字幕来源，可以显示 7TV、FFZ、BTTV 表情包，也能把语音识别结果发送到 Twitch 聊天或 Discord 频道。提供场景系统，可以保存多套设计方案，并在 OBS 切换场景时自动切换字幕样式，通过 obs-websocket 插件能一键完成 OBS 配置。

7,163

(大学教員)西村良太🥞さよなりω

(大学教員)西村良太🥞さよなりω

@sayonari

Jan 27

こんなの音声認識・翻訳モデルを手元PCで動かすやつは重くて不安定なの分かりきってるむしろこれで， ChromeのWebSpeechAPI（音声認識字幕ちゃん）の凄まじい軽さと安定さがバレてもっとみんな使い出す予感がするな🙄

1,231

Justin White

Justin White @kyjus25

Jan 13

Replying to @wesbos

I want WebSpeechAPI in Bun/Node. Huge L for LLM applications. The current solutions suck dog water

227

花子ちゃんAI株式会社

花子ちゃんAI株式会社

@yu29ozaki

23 Nov 2025

Replying to @chibikko_di

WebSpeechAPIはゼフィルスとディープインパクトに実装してるんですが、こんな感じじゃないかも。バージョンかな？見てみます！

thirdlf (さどるふ)

thirdlf (さどるふ)

@thirdlf1

21 Sep 2025

WebSpeechAPI精度高いな #58hack

144

EMPEROR

EMPEROR @Emperor1019

7 Sep 2025

Day 7 of #30Dayscodingchallenge Hit a new milestone today! For Day 7, I built a Text-to-Speech Reader using the native Web Speech API. This was a really cool project write-to-speak-day-7.vercel.… #Day7 #JavaScript #HTML #CSS #WebDev #WebSpeechAPI #30Dayscodingchallenge #FrontEnd

内田勉シェアハウス入居者募集巣鴨/池袋/富士見台

内田勉シェアハウス入居者募集巣鴨/池袋/富士見台

@sidodtv

31 Jul 2025

今日の日付を読み上げるWebアプリを作りました (Claude Codeが) 今はWebSpeechAPIで味気ない声だけど、明日にはVoiceCoreで作ったイケメンボイスに変更予定なぜ明日かといえば、イケメンボイスの生成が1晩たっても終わらなかったから。。。 d-t-v.com/prog/voicetime/

220

安東竜平 | Link AI

安東竜平 | Link AI

@airunner_linkai

17 Jul 2025

おおおと思って触ってみたけど、事前に録画された動画をループで流していて、WEBSpeechAPIで音声認識して音声に合わせた動画を流している仕組みだったなので全然Aniと違うけども、このブームに乗ってこのスピード感で出すみたいなところは見習わないといけない。。AI時代はセンサーが大事

0:28

チャエン | デジライズ CEO《重要AIニュースを毎日最速で発信⚡️》

@masahirochaen

17 Jul 2025

今世界中で話題のGrokのAIコンパニオンが早くもオープンソースで公開。 AI業界は公開後数日あれば模倣品がオープンソースで公開される非情な世界。

0:28

2,981

癒色えも(イシキ•エモ)

癒色えも(イシキ•エモ)

@ishiki_emo

8 May 2025

AIで作りたいものを作って新たに学ぶことも多いなぁって感じますこないだから作ってる「私のコピーAI」も対話部分を作るにあたって「Pythonでいい感じに音声認識してAPIに渡してTTSに渡して～っていうやつ作りたいの。音声認識部分はWebSpeechAPIにしたいから、フロント作ってJsでPythonにそのまま命令渡せるみたいなのいけそ？Django使うほどじゃないからもっと原始的なのでいいですよっ。大まかな流れは～……（以下略）」ってAIさんと相談したらFlaskで作ってくれて私は当時Flaskについて知らなくて笑プロトタイプにこんなお手軽なのあったなんてっ！笑こないだFlaskについて改めて勉強して、今度はCursol使って大規模リファクタしました…笑

936

Gbolahan dislikes APC

Gbolahan dislikes APC @_TheGbolahan_

5 May 2025

Remember when I said this? I finally integrated webspeechAPI into the software. I wanted to use Google's speech API but na money. I go soon host am so y'all can play with it and give feedback

Gbolahan dislikes APC @_TheGbolahan_

27 Apr 2025

I couldn't successfully integrate the speech thing into my app. What a disappointment that is

365

なかつがわ

なかつがわ @someone7140

25 Apr 2025

へぇ「WebSpeechAPIはW3C（World Wide Web Consortium）によって策定された　主に下記の2つをブラウザ上で音声データを取り扱うAPI」 zenn.dev/east_takumi/article…

173

Qiita人気記事/執筆者紹介

Qiita人気記事/執筆者紹介 @q_hayari

27 Mar 2025

【Qiita】本日のすごい人 [ Python 学習メモ WebSpeechAPI 音声入力 FastAPI ]に関する記事を書いた @TadatakaTakaha1 さん : qiita.com/Tadataka_Takahashi…

[備忘録] Pythonで作る音声入力対応Webページ - FastAPIを使った実装 - Qiita

はじめに音声技術の進歩により、テキスト入力だけでなく音声による入力にも対応したウェブサイトやアプリケーションの需要が高まっています。この記事では、Python（FastAPI）とJavaScriptを使用して、簡単な音声入力に対応したウェブページを作成する方法をステッ...

qiita.com

256

ずのう

ずのう @zunow150poke

15 Aug 2024

Replying to @osomimao

サーバ側はGAE上にPythonで書いていて、Django系のフレームワークだと思います。クライアント側の音声認識はWebSpeechAPIを利用しています。あとはjQueryくらいしか使っておらず、登録側もブラウザで動かすWebアプリです。デザインはGentelellaというBootstrap系のテンプレートを利用しています。

801

かめ

かめ @kamekame_manabi

17 Jun 2024

6/11(火) 《Day142》本日の学習時間：10.5H 総学習時間：700H 【内容】自己分析面談① バトランアプリ続き家族に触ってもらって、WebspeechAPIの不具合解消とgoogle認証導入の検討 topページの説明書きの追加導線の検討その他コードの微修正ある程度開発進んだら、周りに意見もらうことが大事

201

Joe Colantonio

Joe Colantonio

@joecolantonio

21 Apr 2024

Discovered a game-changer for developers: the #cypressvoiceplugin. Developed by Dennis Bergevin, this tool uses the #WebSpeechAPI to provide auditory feedback on test outcomes and runtimes. Ideal for enhancing #debugging efforts! 👉 testguild.com/podcast/news/n… @Cypress_io

1:06

2,099

Nearform

Nearform @nearform

20 Dec 2023

Learn how we harnessed the power of Web Speech API and Google Cloud Translation, seamlessly integrated with @fastifyjs. nearform.com/blog/real-time-… #GoogleCloud #API #WebSpeechAPI #Fastify

Real-time Translation with Web Speech API, Google Cloud Translation & Fastify | Nearform

Nearform is an independent team of engineers, designers and strategists. We build digital capability and software solutions for ambitious enterprises seeking sustained business impact. We love what...

nearform.com

388

あきみずてん

あきみずてん

@damatsuti

23 Nov 2023

WebSpeechAPIだと漏れちゃうからね…　これ結構面白いことできそう

130