但问题是他们想要利用自己的同时文字转WAV音频