おそらくN回目の指摘だと思うけどGoogle clabにwhisper入れて、独自の処理(文節処理やLLMによる校正、固有名詞を指定する)を自分用に最適化して使うのもかなりよい
業務レベルだとOA前素材は当たり前に外のLLMにデータを投げられないので、プロユースでもこのやり方なら結構戦える
【🆓無料版!フルテロップを最速で作る方法】
SNSではAIを使ったフルテロップ作成術が色々紹介されています。
実際に試してみると、
🔸思ったほど精度が出ない
🔸サブスク代がかかる
🔸結局手直しが多い
ということも少なくありません😭
そこで今回は、私が色々試した結果、現時点で一番効率が良いと感じている方法をご紹介します。
もちろん無料でできます。
⚠️Vrewは一定時間を超えると有料です。
やり方👇
1⃣ Premiereで編集
カット編集を行い、MP4で書き出し。
(フィラーワードのカットはお好みで)
2⃣ Vrewで文字起こし
設定は以下。
🔹文字サイズ:125
🔹最大文字数:34
🔹分割基準:意味
その後、SRT形式で書き出し。
3⃣ Geminiで校正
ChatGPTやClaudeでも可能ですが、試した範囲ではGeminiが一番安定していました。
プロンプト⬇️
以下は自動音声認識によるSRT字幕です。
音声認識による誤変換を修正してください。
また、以下のフィラーワードは削除してください。
・えー
・あー
・えっと
・えーっと
・そのー
・あのー
話し言葉は維持してください。
要約は禁止です。
リライトは禁止です。
句読点を追加しないでください。
字幕番号、タイムコード、
字幕数、改行位置は変更しないでください。
修正後のSRTのみ出力してください。
4⃣ Vrewへ戻す
Geminiで校正したSRTを保存し、Vrewへ読み込み。
5⃣ Vrewで最終調整
意味に合わせて分割・統合。
文字サイズ125でプレビューしながら、必要に応じて2行になるよう調整します。
その後、再度SRT形式で書き出し。
6⃣ Premiereへ
SRTを読み込み。
タイミング調整とテキストスタイル適用で完成です。
Geminiに分割・統合までやらせる方法も試しましたが、日本語の文字数管理や改行位置がまだ不安定でした。
結果的に、
Vrewで文字起こし
↓
Geminiで校正
↓
Vrewで分割・統合
の方が早くて安定するという結論になりました。
もちろんTV番組やYouTubeなど媒体によって文字数調整は必要ですが、フルテロップならかなり実用的だと思います。
「もっとこうした方が良い」という方法があれば、ぜひリプで教えてください。