常時録音型AIボイスレコーダー Fieldy 3 を使ってみた。
Limitlessデバイス経由のOmiアプリと比べて日本語の文字起こし精度はやはり高い印象。
ElevenLabs の Scribe を採用しているからかな?
ただ、文字起こしミスがあるときに元音声を確認できないのは困る(プライバシーの理由で文字起こし後に元音声は自動削除される)
オプションで元音声を残せるようになったら良いんだけど、難しいだろうなぁ…
理想は
➀常時録音前提
➁最低朝から夜までバッテリー持つ
➂日本語の文字起こし精度高め
④元音声残る
⑤ほぼリアルタイムで自動で音声の転送→文字起こし→要約
PlaudNotePinは文字起こし精度は高くバッテリーも1日持つし元音声も残って良いんだけど、アプリが常時録音前提ではなくて転送も手間がかかる。
無理やりやるなら、転送→5時間ごとに区切られた音声ファイルのマージ→要約、となかなか面倒。
AutoFlowで1日分の音声のマージ→指定したテンプレートで要約、ができたらいいんだけど、それもできない。
うーんそうなると元音声が残るOmiによる運用がいいのか…?
Omiアプリに対応していて最も集音能力の高いデバイスはどれなんだろ。
STTモデル変えたら文字起こし精度ましになるかなぁ…
なぜFieldy 3の日本語文字起こし精度に期待できるかっていうと…
Fieldy3がElevenLabsのSpeech-to-Textモデル「Scribe」を使ってるって知ったから。
話者分離も短い音声から強いみたいだし、常時録音対応のAIボイスレコーダーとして期待できる。
すでに発送中らしいので届いたらレビューしますね!