因为我们下一步的目标就是他俩文字转WAV音频