毕竟他无法分文字转WAV音频