写在前面
小新16gb在开两个虚拟机一个
idea
后绷不住了,自己搞了个64gb的极光X,4070放着也是放着,就想着搓个ai出来,预计效果应该是类似ai主播neruo
语音
决定使用更模块化且对新手友好的 GPT-SoVIT
素材是b站上好人做的丽宝切片
顺便搞了个 UVR来分离人声伴奏,方便后面唱歌用,大概下了这么几个:
MDX-Net | MDX23C-InstVocal HQ: 开源下目前最好的分离人声及伴奏
VR Architecture | 5_HP-Karaoke-UVR: 分离和声(激进)
VR Architecture | UVR-DeEcho-DeReverb: 去除混响和回声(激进)
跑到2w步的时候感觉出问题了,丽宝的语音抑扬顿挫太多了,没原来的感觉
试了下唱歌,效果巨差,打算问问成功的佬,先搁置一下,去研究api跟对话
AI_rei-从零开始的手搓丽宝
- 本文链接: http://noone40404.github.io/2024/08/01/AI_rei-从零开始的手搓丽宝/
- 版权声明: 本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!