ブログ書くのわすれてたよね
RCVとかいうボイチェンで遊んだ
驚異の高精度AIリアルタイムボイチェン「RVC」で友人になりすまして本人と会話したときの反応(CloseBox) | テクノエッジ TechnoEdge
ドリキンさんのvlogをよく見てるんですが、そのvlogで高精度のボイスチェンジャーの話が出てた。
リンクはその内容が書いてある記事なんだけどいろいろ試して遊んでた。
とりあえずVOICEROID2のあかりちゃんで50分くらいのデータを作って20分くらい学習させてみた。
ちょっと音質が悪いところがあるけど十分自然に変換できてる。
元記事では「20分程度のデータでも十分」みたいな話だったのでデータを減らして学習回数を増やしてみた。多分学習時間としては40分くらい。
多少音がよくなった気がする。
調子にのって5倍時間かけたら5倍よくはなからなかった。学習回数は割りと早いところで頭打ちになる感じらしい。
データの質を上げる方が良さそう。
ゆかりさんでも作ったりした。
ボイチェン界隈では去年辺りにMMVCというものが流行っており、かなり精度が高いんですが
「自分の声を100個録音する必要がある」とのことで死ぬほど敷居が高い。
さらに学習も十時間以上かかる(らしい
RVCはMMVCに比べると精度が低く変換時の遅延も大きいが、10~20分程度の音声データを同じくらいの時間学習させるだけでそれなりの精度でボイチェンとして扱える。
めちゃくちゃ敷居が下がったおかげでいろいろ試しやすくなったが、悪用もしやすくはなったと思う。
あんのーんが中学生だったら好みの女の子の音声データをどうにかして録音しようとかしたかもしれない。スマホもある現代なら10分程度の音声を集めるの割りと現実的なので…
とりあえず遊んでみたけど別に自分の声をどうしても出したくないとかはないのでこれ以上の用途は思いついてない。
小ネタ
ありふれた職業で世界最強のギャグコミカライズ「ありふれた日常で世界最強」のこのコマ良すぎる。
ちなみにアニメや真面目な方のコミカライズよりも圧倒的に先の展開の話が出るのでめちゃくちゃネタバレが入る(が、ギャグである
懐かしすぎて泣いてる<br/><a href="https://unkworks.net/media/34e657cfa76c30918d303ea13f5d6340502acc07e1c9dd6d2d57f4d3eeda147e.png?name=exice_z.png">exice_z.png</a>
とても可愛い<br/><a href="https://unkworks.net/media/cd09dfe402f25e9cfe37cc82fb986bf63010e8efdcff6f5f0dbdcd40295da55e.png?name=1.png">1.png</a><br/><a href="https://unkworks.net/media/6a87f4f8f0b047646e02539262435904e1fb858df4c4232907a8a9e1fd289d10.png?name=2.png">2.png</a>
伺かならイクサイスゼロが好きって話。昔から女の子の好みが変わってなくて癖だな…ってなってる。
2個目のやつはマウスカーソルで頭を撫でると帽子を取ってくれるんだけどそこでクリックすると「なんで叩くかな…。」ってなる。かわいいね。
作者の人は今でも絵を描いててtwitterに上げてたりするんですが、昔はロリな女の子が中心だったんだけど今はボテ腹がメインになってて何が起きたんだ…ってなる(普通の絵もあります
tootにURLが含まれるときの扱いが雑なのでどうしようかな…
今週の餃子。なんとなく斜めアングル。