有个小伙伴找到杜老师,说上篇分享的工具中分片功能不好用。这里为需要的小伙伴提供另一款工具,可以很简单的实现音频切片,并对 So-VITS-SVC 工具兼容性很好,欢迎下载体验!
slicer-gui 软件名为 Audio Slicer,为 OpenVPI 团队制作。
工具可以根据音量、间隔等参数对音频进行切片,对 So-VITS-SVC 工具的兼容性很好,非常适合模型训练。
下载好压缩包,解压后打开软件包目录,找到并打开 slicer-gui:
点击 Add Audio File 添加需要切片的音频文件「这里强烈建议使用 WAV 的格式」点击右侧的 Browse 设置输出目录,最后点击 Start 就行了:
切片完成后请检查一下每个切片时长,如果超过 15 秒,请调小 Maximum Silence Length 阈值。
然后将时长超过 15 秒的文件重新切片,直到所有音频文件时长低于 15 秒。这样训练效果最好。