音声合成を勉強しています。歌声合成に特に興味があります。音声合成に関わる全ての人に尊敬と感謝を。業界の外の人ですが、絡んでくれると喜びます。

Joined February 2022
111 Photos and videos
pyshiro(音素アライメントツールSHIROのPython移植)に、既存の音素ラベルを学習済みモデルのラベルの付け方に変換する機能を追加しました。長いラベルの途中や、オプションで固定した音素境界に囲まれた領域を断片化し、再ラベリングします。(2枚目…実行前、3枚目…実行後) github.com/wavtechyukky/pysh…
1
14
881
NHVSingの音質めっちゃ不満になってきた v/uv使うしかないのか…
1
84
Claude使用量リセットされたらしいから入れられるだけ検証用のパラメータ足そう
127
音響モデル(LYNXNet)はDiffSingerと大体同じはずだけどあっちは発音大丈夫なのだろうか? 自分の使い方が悪いだけ? ともかく、Diffusion系でない綺麗な音響モデルは2022年くらいにはもうあったので、古いやり方の中に正解はあると考えよう
1
1
4
503
F0モデルが終わりなきエベレストすぎる 研究はされててもSVSが出てこない理由の何割かこれで占めてるのでは…
2
195
早口だったり音高が高い曲をやらせたら発音がかなり酷い感じになった。子音長の計算方法とかを改良してみたが、教師データが足りないんだろうか…? なんにしても、CeVIO AIってよくできてたんだな…。
6
47
2,787
Fable 5ポン出しで色々作れるとかいってるけど本当かな… Opusと毎日散々議論してるんだけどLLMなんて専門外のことはどう頑張ってもこんな感じでしょう
3
241
F0生成にGAN入れたけど効いてるか…? なんか前の方がいいまである気がしてきたが…。
1
158
つまりはこんな感じです。低めのテンションにしたい時はイントネーションやビブラートを抑え、強い表現が欲しい時はイントネーションやビブラートを強化できます。
作ってるF0モデル ・イントネーションとビブラートを分離して学習を簡単にする ・使用時は、イントネーションもビブラートもユーザーが強度を調整できるようにする
1
6
47
3,284
ゆっきー@音声合成 retweeted
AriaSVS公式アカウントを作成しました! 今後、開発進捗やお知らせなどは主にこちらでも発信していく予定です。 よければフォローしていただけると嬉しいです! @ARIASVS_Officia
1
4
171
Applio版のNSF-HiFiGANとRefineGAN(元論文より軽量化されてある)の速度ほぼ変わらない…。というか速度を重点的に上げたうちのNHVSingより速い。これで音質もいいなら他のボコーダー使う理由がなくなるぞ
2
11
674
作ってるF0モデル ・イントネーションとビブラートを分離して学習を簡単にする ・使用時は、イントネーションもビブラートもユーザーが強度を調整できるようにする
1
5
23
4,642
個人的にはv/uvに依存するシステムは否定派なのだけど、誰でも利用できるユニバーサルなものを作りたい。NSF-HiFiGANとかはv/uvあってもなくても良い感じだから素晴らしいと思う
2
254
pyshiro(音素アライメントツールSHIROのPython移植)に、既存の音素ラベルを学習済みモデルのラベルの付け方に変換する機能を追加しました。長いラベルの途中や、オプションで固定した音素境界に囲まれた領域を断片化し、再ラベリングします。(2枚目…実行前、3枚目…実行後) github.com/wavtechyukky/pysh…
1
14
881
公開している学習済みモデルは、 ・破裂音と破擦音は無音区間を含めてラベリングする ・母音は概ね完全に無音になる前にラベルを区切る というようにラベリングします。(音響モデルがノートの途中で母音の波形を終了させてしまうのを防ぐため)
2
201
多分気のせいだったのと、Macのトラックパッドで非常に高速でスクロールされてしまう問題は、波形やラベルの拡大をトラックパッドではなく「in」ボタンで行うことで解消されると分かりました。積年の問題が解決
Praatずっと更新してなかったんだけど、今アプデしたら操作性がよくなってた。感謝…!
3
397
pyshiroに、既存の音素ラベルのラベルの付け方を、学習済みモデルの付け方に変換する自動ラベリング修正機能と、音素ラベルの外れ値検出の追加を実験的に試しています。正しそうなものも検出されるが、多く検出される分にはいいだろう…。
1
1
20
914
実際には明確に失敗しているケースより、微細なこだわりでラベルを治したくなるケースの方が圧倒的に多いと思う。自分が神経質になりすぎなのかもしれないが、音素ラベルはまだまだ人が見ないといけないと思う…。
1
167
Praatずっと更新してなかったんだけど、今アプデしたら操作性がよくなってた。感謝…!
5
670
ラベリングの基準の変換、ある程度自動化しても確認作業は人力でやらなければ…。一曲だいたい20分かかった。もっと楽にならないもんだろうか…。
1
2
195