現在開発中の「AIキャラクター(VRoidモデル)との音声対話ゲーム」の進捗です。
# 作業内容
前回紹介した、「uLipSync」を利用したリップシンク(口パク)アニメーションの精度向上のための作業を行いました。
具体的には、VOICEVOXの「小夜」の合成音声のキャリブレーション(声の特徴を登録する処理)を行いました。
キャリブレーションには、以下の合計18点の音声を使用しました。
# キャリブレーションに使用した音声
1. "あ"の音声3点
それぞれ、"あ"、"あー"、"あーーーーーーー"と発声するのみの「小夜」の音声です。
すべて同一のスタイル、パラメータ(声のピッチや抑揚など)の音声となります。
これらの音声を使用して、音素"あ"の特徴を3点登録しました。
2. "い"の音声3点
同様に、"い"、"いー"、"いーーーーーーー"と発声するのみの音声です。
これらの音声を使用して、音素"い"の特徴を3点登録しました。
3. "う"の音声3点
4. "え"の音声3点
5. "お"の音声3点
6. "ん"の音声3点
# 結果
動画前半は、キャリブレーション**前**、中盤は、キャリブレーション**後**のリップシンクアニメーションです。どちらも同じ「小夜」の合成音声("私の好きなゲームは...")をリップシンクさせています。
残念ながら、キャリブレーション後も、相変わらず若干不自然なリップシンクのアニメーションになりました。
対策として、以下の作業を検討しています。
動画最後は、キャリブレーションの様子で、"あ"の音声を使用して"あ"の音素の特徴を登録しています。
# 今後の展望
### キャリブレーションの再実行
キャリブレーションに使用する音声を変更して再実行します。
例えば、スタイルやパラメータの異なる音声を使用します。
また、"あー"のような単一の音声ではなく、通常の会話音声("こんにちは、元気してる?私は..."など)を使用します。
### ゲームへのuLipSyncの実装
本ゲームに本アセットを実装し、VRoidモデルにリアルタイムなリップシンクを行わせます。
# UnityChanのライセンス表記
© Unity Technologies Japan/UCL
# 関連URL
### 【本ゲームの開発記録(前回)】uLipSyncを試す
x.com/miya00907380/status/18…
### 【本ゲームの開発記録】Full Emoji Support Apiを実装
x.com/miya00907380/status/19…
### 【本ゲームの開発記録】VOICEVOXのAPIを実装
x.com/miya00907380/status/18…
### 【本ゲームの開発記録】本ゲームの概要について
x.com/miya00907380/status/18…
### uLipSync
github.com/hecomi/uLipSync
# タグ
#uLipSync #AICharacter #TTS #Unity #GameDevelopment