而是他自己的状态就是不对文字转WAV音频