所以并没有再细问出声文字转WAV音频