一开始他们并未注意文字转WAV音频