于本年 9 月初次发布。VoxCPM 是一个 0.5B 参数尺寸的语音生成基座模子,正在模子参数有所添加的前提下,正在连结速度的同时提拔了音频生成质量。AudioVAE 采样率从 16kHz 提拔至 44.1kHz,模子可按照高质量音频,克隆结果更佳、细节更丰硕的声音;