so-vits-svc - 一个开源AI音乐语音合成人声克隆模型
So-VITS-SVC是一个基于VITS(Vector-Quantized Variational Autoencoder with Multi-head Self-Attention)的开源人声克隆项目,可以用来生成高质量的人声合成音频,特别是用于翻唱歌曲。
So-VITS-SVC是由B站UP主@Saya睡大觉中和@羽毛布団共同开发的一个开源项目,其目标是实现端到端的人声克隆,即只需要输入一段人声音频和一段歌词,就可以生成相同或相似的人声唱出歌词的音频。该项目基于VITS模型,但做了一些改进和优化,例如增加了SVC(Speaker Verification Classifier)模块来提高音色的相似度,以及使用了更高采样率(44.1kHz)来提高音质。该项目目前已经发布了4.0版本,并提供了多种语言(中文、日文、英文等)和多种音色(碧蓝档案、初音未来、洛天依等)的预训练模型供用户下载和使用。
开源地址: